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本 书 介绍 了 有 关 回 归 分 析 、 重 回归 分 析 以 及 Logistic 回 归 分 析 的 实用 统计 学 知识 。 

回归 分 析 和 重 回归 分 析 可 以 解决 很 多 实际 生活 中 的 问题 ， 例 如 : 

@ 通过 “最 高 气温 ”来 预测 “ 冰 红 茶 的 销售 量 ”。 

@ 通过 “店铺 面积 ”和 “距离 最 近 车 站 的 距离 ”来 预测 “新 分 店 备 选 店铺 的 月 营 
业 额 ”， 并 进行 数值 预测 。 

Logistic 回 归 分 析 可 以 解决 的 问题 例如 : 

@ 通过 “吸烟 量 ” 和 “饮酒 量 ” 来 预测 “癌症 的 患 病 率 ”的 概率 分 析 。 

本 书 的 使 用 对 象 包括 : 

@ 阅读 完 《漫画 统计 学 》 或 者 具备 同等 程度 以 上 统计 学 知识 的 读者 。 

O 需要 进行 “数值 预测 ”和 “概率 预测 ”的 读者 。 

本 书 由 以 下 4 章 组 成 : 

@ 第 1 章 基础 知识 

@ 第 2 章 回归 分 析 

@ 第 3 章 重 回归 分 析 

@ 第 4 章 Logistic 回 归 分 析 

各 章 又 包括 : 

@ 漫画 部 分 

@ 对 漫画 部 分 进行 补充 的 文字 说 明 

第 1 章 所 讲 的 内 容 ， 是 学 习 第 2 章 及 以 后 内 容 时 所 必 备 的 基础 知识 ， 像 微分 、 和 矩阵 
等 等 ， 可 能 是 大 多 数 读 者 在 高 中 的 学 习 过 程 中 就 已 经 学 过 的 内 容 。“ 如 果 第 1 章 的 内 容 
都 没 办 法 理解 ， 还 怎么 阅读 第 2 章 以 后 的 内 容 啊 ”一 一 读者 大 可 不 必 心 存 这 种 不 安 。 在 
阅读 的 过 程 中 ， 您 会 逐渐 地 体会 到 “原来 对 数 就 是 这 个 意思 啊 ! ”“ 微 分 就 是 这 样 的 
运算 啊 ， 没 错 、 没 错 ， 我 想起 来 了 ! ”不 过 ， 对 于 那些 “完全 忘记 了 ， 看 了 也 想 不 起 
来 ”、“ 因 为 我 是 文科 生 ， 几 乎 没 学 过 ”的 读者 来 说 ， 如 果 不 花 些 功夫 去 理解 第 1 章 的 
内 容 ， 就 想 读 懂 本 书 的 主体 ， 也 就 是 第 2 章 以 后 的 内 容 ， 可 能 会 十 分 辛苦 。 

本 书 中 的 计算 过 程 记录 得 相当 详细 ， 数 学 基础 好 的 读者 只 需 仔细 地 看 一 遍 即 可 。 


数学 基础 稍 差 的 读者 ， 则 要 用 心 揣摩 、 多 加 思考 。 即 便 是 那些 觉得 意思 不 太 明白 、 计 
算 起 来 也 困难 的 读者 ， 也 请 按照 书 中 的 步骤 把 解 求 出 来 ， 这 样 做 起 码 可 以 掌握 大 致 的 
计算 流程 。 读 者 没 必要 强迫 自己 一 次 就 理解 ， 要 耐心 地 坚持 读 到 最 后 。 不 过 在 阅读 过 
程 中 ， 请 您 一 定 要 全 神 贯 注 。 

在 阅读 中 ， 如 果 存 在 读者 自己 的 计算 结果 和 书 中 的 计算 结果 不 一 致 的 情况 ， 这 
可 能 是 对 数据 进行 四 舍 五 人 的 原因 。 如 果 因 此 给 读者 带 来 不 便 ， 还 请 各 位 读者 多 多 谅 
解 。 

能 够 有 这 次 执笔 的 机 会 ， 我 要 感谢 株式 会 社 欧姆 社 开发 局 的 诸位 。 感 谢 将 我 的 原 
稿 制 成 漫画 的 株式 会 社 TREND-PRO 的 诸位 。 感 谢 负责 脚本 创作 的 re_akino 先 生 ， 以 及 
负责 绘画 的 Inoue Iroha 先 生 。 另 外 ， 立 教 大 学 社会 学 系 的 酒 折 文 武 先生 为 之 前 的 作品 提 
出 了 诸多 宝贵 建议 ， 在 此 深 表 谢意 。 


高 桥 信 
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今天 怎么 样 ? 
还 是 在 学 习 吗 ? 
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HAMZA, tk 
不 会 吃 酷 了 吧 ? 
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| | ERAAMA SAL 
ae ae 很 难 的 数学 书 
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に Fl 
z ~ 真是 个 勤奋 用 功 的 A: 等 一 
j > — — 
学 系 ”的 吗 ? 
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有 ! 那 家 伙 把 书 
落下 了 。 
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比方 说 ， 在 诺 伦 我 们 将 每 天 的 “最 高 气温 ” 
和 “ 冰 红 茶 的 销售 量 ”都 记录 下 来 















如 有 果 做 “回归 分 析 ” ， 我 们 或 可 


以 通过 最 高 气温 来 预测 冰 红 茶 的 








类 似 地 还 有 “ 重 回 


根据 一 个 因素 进行 预测 称 为 “回归 分 析 "， 
根据 多 个 因素 进行 预测 称 为 “ 重 回归 分 析 "。 


— | 
EE Eg A 
这 一 个 因素 ， 来 预测 
六 红茶 的 销售 量 。 


R 
很 
重 
的 
意 
A 
中 

* 






















我 来 给 你 举 个 例子 吧 。 某 个 
连锁 店 的 经 理 一 定 会 掌握 现 
有 店铺 的 情况 : 


"与 竞争 对 手 的 距离 
* 方 500 AMA HEE RH 
HER 


等 等 ， 类 似 的 数据 对 吧 ? 


那么 在 考虑 开设 新 的 
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与 竞争 对 于 | FOX 
wm ee SER 












如 果 使 用 重 回归 分 析 的 话 ， 
就 能 够 通过 
与 竞争 对 手 的 距离 
+H 500 来 以 内 的 住宅 数 
"宣传 费 


来 预测 “营业 额 ”了 。 


ooo | 000 | ooo 
AAA | AAA | AAA 
Doo | ooo | ooo 

























Sum 
O00 
AAA 


口 口 口 
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请 您 教 我 回归 分 析 吧 ! 」 ノ M AN 

















真 的 不 想 把 那 本 书 
直接 还 回去 了 吗 ? 


NANG 
ws NN 



















































































































































































Re! 、 首先 ， 我 们 未 学习 
不 过 如 果 我 们 马上 数学 中 的 书写 规则 。 
—* 









































这 个 是 “规则 "， 所 以 
不 用 问 为 什么 ， 只 要 
按照 它 做 就 可 以 了 


MW ll Thame Ws Pe) 

















ie 


fee ae 
d wi 





摘自 话说 ， 
到 要 主人 一 
样 ， 而 了 就 
是 为 他 服务 
HEM 






































ie 所 谓 反 函 数 
— the 
| am 
以 下 犯 上 上 








但 还 没有 推翻 1 














回 到 原来 的 话题 ， 
cH 的 反 浮 数 就 是 …… 


Y=2x+] 
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那么 ， 我 们 现在 就 从 
图 像 上 对 反 函 数 进行 
解释 吧 | 

ンプ 


アツ 


f= 
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kA! 
拿 支 钢 笔 来 。 














































































































































































































画 好 了 。 
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试 着 变 成 我 们 常见 的 
坐标 方向 。 





这 样 的 话 ，x 轴 方 向 
不 就 左右 相反 了 吗 ? 
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& 3. 指数 函数 与 自然 对 数 函 数 cv 



























好 ! 





来 讲 下 一 课 。 类 似 这 样 的 
函数 就 称 为 “指数 函数 。 






都 经 过 (0,1) 
点 。 





它 叫 “自然 对 数 的 底 "， 也 叫 


“Napier $”, 


a! 
| RRR 




















Aak, BMH y= eH 
Khe HH "自然 
対数 画数 "。 








但 是 ,由 于 x=” 的 形式 不 易 理解 ， 

所 以 我 们 就 把 x=e BR “y= log, x" 

或 “y=logx” 的 形式 。 
指数 函数 与 对 数 函 
数 有 很 多 性 质 ， 


现在 我 开始 讲 唆 ， 
ELITR | 
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T 














L ae y 
OTE EN し 
为 了 便于 理解 这 条 性 质 ， 我 们 以 { 7 。 为 例 ， 来 具体 






WH, (EF 和 e 是 等 价 的 。 


让 我 们 一 起 算 算 吧 ! 


re 


x…x の =(exexe)x…x(exex の =ex… 
— — — 





性 质 2 


Ehe AFM 





xe=e 


为 了 便于 理解 这 条 性 质 ， 我 们 以 { -5 为 例 ， 来 具体 说 明 ， 


S Ale 是 等 价 的 。 


让 我 们 一 起 算 算 吧 ! 


のど _ exexe = EXEXE oe | 


どの exexexexe exexgxgxp の 





eae 
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T 











| BERST a Fe loge’) 是 等 价 的 ! 








为 了 便于 理解 这 条 性 质 ,我 们 以 a=3 为 例 ， 来 具体 说 明 ，3 和 loge) 是 等 价 的 。 


在 第 20 页， 我们 曾 讲 过 , y=logx 与 x=e 是 同一 个 意思 。 这 就 是 说 ， 如 果 设 
log(e) 为 L， 那么 ,L=log(e’)， 又 因为 L=log(e’) 与 e=e: 等 价 ， 我 们 就 可 以 把 e=e 改 
写成 下 面 的 形式 ， 

の = の 
3=L 
由 于 Z=log(e)， 所 以 等 式 3=log(e 成 立 。 








[ HEAD loga’) 和 bx(loga) 是 等 价 的 ! > 





为 了 便于 理解 这 条 性 质 ， 我 们 以 人 为 例 ， 来 具体 说 明 ，log(39 和 5xlog3 是 
等 价 的 。 


Ü L=log3, Mi L=log3 与 3=e 是 等 价 的 。 我 们 就 可 以 把 3=e: 改写 成 如 下 形式 。 
3=e es 
J 
Spl x eR E 





log(3*)=log(es*4) 
log(3)=5 x L Bd 
HF L=log3, 所 以 等 式 log(33)=5 x (log3) 成立 。 


= 











L — 
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ーー es 














| ss logatlogb 和 log(a Xb) 是 等 价 的 ! > 





=3 
为 了 便于 理解 这 条 性 质 , 我 们 以 {p-s 为 例 ,来 具体 说 明 ， 
log3+logs 与 log(3x5) 是 等 价 的 。 





L=log3 L=log3 3=e 
af M=log5 , W {tos 与 { S=eM 是 等 价 的 。 
N=log(3x5) N=log(3x5) 3x5= の 
我 们 可 以 把 x ee=3x5 改 写成 

どの x の =ex…xexex…Xxe=ex…xe= ニ 〆 ツ = ニ 3xS 

所 以 exe=3x5=e 成立 。 

由 于 L+M=N， 

所 以 log3+log5=log(3x5) 成立 。 


(ey he Sth. 
Sie St. 
a 和 logie) 等 价 。 














1og(@) 和 bx (loga) 等 价 。 
loga+logb 和 log(axb) 等 价 。 
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Te ! 接 下 未 我 人 W 


N 学 习 身分 | 


RK, TLEH | 
RASEK, URAR 
è! 


么 难 叭 
我 给 你 好 好 讲 讲 ， 你 要 加 
at | 








美光 的 “年 龄 ”和 “身高 









FROD PREI) / 这 是 关羽 从 和 进入 幼儿 园 开始 
4 | 100.1 到 现在 的 身高 数据 。 
5 107.2% 

6 114.1 
Y | fone 
è 126.8 
9 130.9 
7 の 137.5 
77 143.2 
(2 149.4 
13 ($1.6 
14 164.0 
(S | 154.6 
16 155.0 
(7 (S51 
3 158.3 
9 158.7 





那么 ， 把 这 个 表 
对 应 的 图 形 画 出 











fy arenes . — 
6n (3 I4 15 16 (7 18 19 
£5 FF lotl 12 (3 I4 7 Ae) 
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那么 ， 让 我 们 来 看 看 6 岁 
和 了 7 岁 时 的 美 羽 吧 ! 


从 6 岁 到 7 岁 
一 年 之 间 
长 了 121.7 
114.1=7.6cm。 





然后 ， 再 加 到 刚才 的 问题 
BMA MI fa, KKH 
讲 一 下 ， 美 羽 从 4 岁 到 19 


Yi RM fe TZ P; 
\ y 3 … 丰 在 着 这 样 的 关系。 


ANK ER D SR CRD 
Way 20-9 4173.3 w) 





サー の 











“BE TE 171819 
EF XCD) 


26 第 1 章 基础 知识 


这 ， 这 个 
326.6 
—— NN 


是 什么 啊 ? 


你 看 ， 我 们 是 不 是 可 
以 把 TH” KER 
“(6+1) 岁 " 有 ? 





就 是 通过 “回归 分 析 ” 被 我 的 话 开 糊 涂 了 吧 ? 关 
求解 出 来 的 “回归 方 于 “回归 方程 ”， 我 们 以 


那 就 先 把 我 的 年 龄 和 身高 之 间 这 个 
a 4173.3 


这 样 的 话 ，“ 从 6 HH (6+1) 岁 这 1 年间 所 长 高 的 身高 " 
用 刚才 的 式 子 


O) FHSS 


(- — HR. :)- (- 246 


… 就 可 以 大 致 
计算 出 来。 


(3266 8 EA m) 
如 此 说 来 ，" 从 6 岁 到 (6+1) (Gry 33 ( Sey 


岁 这 1 年 间 ， 身 高 的 年 平均 
增长 率 ” 就 应 该 是 这 样 。 









| 
1 年 间 所 长 高 的 身 
高 ， 再 除 以 1。 
iT 


那 再 想 一 想 ， 半 年 内 增 
加 的 身高 吧 | 





“从 6 岁 到 (610.5) 岁 这 0.5 年 间 所 长 那么 "从 6 岁 到 (610.5) 岁 这 0.5 年 间 
的 身高 "… 身高 的 年 平均 增长 率 ” 就 是 这 样 


COLE 


3 EA 
( 6 | 7 
—— +m3}- [ t pm. 3) pH e cm 


(6t05) 0.5 


0.5 年 间 所 长 
高 的 身高 ， 再 


除 以 0.5。 A 
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用 含有 A 的 式 子 来 表示 
“从 6 岁 到 6 岁 之 后 的 极 
短 时 间 内 ”所 长 的 身高 


(za _( 66 
(atma) ( グー/733 


也 就 是 说 ,，" 从 6 岁 到 6 岁 之 来 吧 ， 让 我 们 一 口 
后 的 极 短 时 间 内 ， 身 高 的 年 平 气 把 这 个 式 子 整理 
均 增长 率 ” 就 是 这 样 的 。 出 来 ! 


| 326.8 _ {366 
(2 sina ( 6 +173.3 
A 





| | 7 sma) 326.6 メ ーー 


A 所 
326.6 , 326.6 


(6+4) 6 s 
A NTT 


4) 





R66 3266 
__& (6+4) 
A SN の 


| 
326. cx 做 
6 aa) ; 1 
= 5326. 
:> の |3zkkx Lows 





326.6x EIA)-6 
= AGT) 


A 在 “ 极 短 时 间 ” 的 情况 下 ， 
我 们 可 以 将 A 看 作 0 


An! 
我 也 能 够 做 到 | 
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那 就 来 接受 一 下 
挑战 吧 | 


326.6 


“AX PAXIZEHABHAA, FHH 
年 平均 增长 率 ” 要 怎样 用 式 隆 进行 表示 他 


— 2684 as 
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_ 3266 
x 


y=- 288 +173.3 RF x RMD", 


+173.3 Kk 326.6 x 十 的 过 各" 


除了 y= 一 285 十 173.3， 


我 们 还 要 试 着 对 其 他 式 子 求 


326.6x 让 要 写成 这 种 


檬 分 ， 你 要 尽快 习惯 这 种 运 
形式 1 HARM | 
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T 
J=% 关于 x 进行 微分 ! 








tAr A, gay BK 
< ms — BL Gale 

















-g 





(tA 
因为 x = 








LE cnx A — 


a 
~ 2x+0=2x, KA 2Xo 











| y= 二 ， 关 于 x 进行 要 分 ! 
































1 _ 1 xGt+A)  -A 
xtA x_ GtAy _ (tA _ -A 1 
A a A ce+Ax A 
— — 
CtrA tO 
所 以 , =a 
一 一 — 
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( y= 二， 关于 x 进行 微分 。 






































th | 
I y G+Ar G+Ar A 
| _-@r+4) 
日 i le+AxT 
) i 
z) -Qr+0) 
| EOF 
x+ +A) x-(x+A) i 
a eee 
J 7, a 1 a 
hrá <À ! 
_ G+ “Fae 1 -2 
a 1 
=-2m 
の っ っ 
mt, B= -2x 
Net 
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ーー 


工 





ji 


ex = 














( V=, ATREA = fi 


ーーーー ーーーーーーーーーーーーーーーーーーーーーー 





A 


{SG+A)-7] + ($x-DHISE+A -7] - $x- 9} 





A 
ee [2(5x - 7) + 5A] x 5A 
A 
= [2(Sx-7)+5A] x5 
= [2(5x-7)+5x0]x5 
= {Sx-7)x5 


因此 ， を =2(5x-7)* 5。 
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我 将 依次 对 


“起 阵 的 书写 规则 


进行 介绍 ， 

























































































\ 好 ， 好 的 ! 


37 











首先 ， 是 矩阵 的 书写 规则 。 
二 +20=-1 1 2|| xs|_|-1 
可以 写 作 : 
EN 
_ 可 以 写作 : [ J) 
3x, + 4x, 3 4)lx 











k+ 26+ 3k= -3 1 2 3 -3 
4k+ 5k+ 6k= 8 4 5 6 | 8 
Tk+ 8+ k= 6 可 以 Sf: | 7 8 9 用 el=| 6 
10k, + 11k, +12k= 2 10 1 12 Al | 2 il 
| 136+146+156= 7 13 14 15 7 
k+ 2k+ 3k is 
4ki+ Sk+ 6k, 4 5 6l|fk 
| Tk+ 86+ 9k。 TUSE: | 7 8 OTK | 
10k, + 11k, + 12k, 10 1 2h, 
13k, + 14k + 15k, 13 14 15 




















LE —— 
38 第 1 章 基础 知识 














其 次 我 们 来 讲 一 下 矩阵 的 加 法 : 
ga 1 和 — ) 相 加， * 
34 -2 4 3 4 


1+ 4 ao 


的 计算 可 按 如 下 方式 进行 : | 
3+(-2) 4+4 


45 
24 





Ee 


seit hE ee ake ‘ 
6 -9) \-3 10) (6+3) ~9)+10) (3 1 





LES T23 
4 5 6| |-1 7-4 

7 8 9|+|-7 -3 10 

10 11 12 8 2-1 

13 14 15 7 1-9 

可 按 如 下 方式 计算 : 

1 2 3 723 1+ 7 
4 5 6| |-1 7-4 4+(-1) 
7 8 9|+|- -3 10|=| 7+(-7) 
10 11 12 8 2-1 10+ 8 
13 14 15 71-9 13+ 7 


2+ 2 34+ 3 8 4 6 
5+ 7 6+(-4) 3 12 2 
8+(-3) 9+ 10 |=| 0 5 19 
11+ 2 124(-1)] |18 13 1 
14+ 1 15+(-9)) \20 15 6 


= 


T 
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接 下 来 ， 我 们 讲 讲 矩 阵 的 乘法 。 


t2 
| f: * ] 虽说 是 “乘法 ”， 其 实 就 是 将 
3 4m » 


2 
| ja 站 单独 运算 ， 也 就 是 表示 同时 计算 
3 4x 3 4) 


+ y+2y, 
3x, + 4x, 3y + 4y, 











E E E i OPEN 
(| (4 $) sree, 


1 站 Pe 
3 2) Gx4+4x(2) 4 

. ( ) | 
3 4) (3 x54+4x4) GI 


因此 , 可 得 | | ‘J. 4 
3 Vl 4) Ms 


12 

45 6 |(k h m m 
789 f h m om 
10 1 12 人 | hom n 


13 14 15, 














H 




















1. 24 3 k+ 2k+ 3k, 
4 5 61k, 4k, + Sk+ 6k, 
7 8 Ol  KI=| 7k + 8k+ Ok 
10 11 12 用 ん 10k, + 11k, + 12k, 
13 14 15 13k, + 14k, + 15k, 
ie a + 2h + 3h 
4 5 6\(1, 44+ 5h+ 6h 
| 7 8 OL |=] 74+ 8+ 9 
10 1 1244 10/, + 1h, +121, 
13 14 15 134, + 144 +154, 
を 23 m+ 2m+ 3m, 
4 5 6 |/m, 4m+ Sms 6m, 
*| 7 8 9 ml=| 7m+ 8m+ 9m, 
*1 10 11 12 m) | 10m,+ 11m,+ 12m, 
13 14 15 13m,+ 14m,+ 15m, 
a oe) m+ 2m+ 3m 
4 5 6|n, 4n,+ Sn,+ 6m 
| 7 8 9 Wn, J=] Tm+ 8m+ 9n 
10 11 12 In, 10n, + 11n, + 12m, 
13 14 15 13n, + 14n, + 157, 
因此 ， 可 得 : 
k+ 2k+ 3k, i+ 2+ 31, m+ 2m+ 3m, n+ 2n,+ 3n, 
4k,+ 5k,+ 6k, 4l,+ Sl, + 61, 4m+ 5m+ 6m, 4n,+ Sm+ 6m 
Tk, + Bt Oh T+ 8h + 9, Im+ 8+ 9m, Tn, + Bm+ 9n, 
10k,+11k,+12k, 104, + 11, +12 10m;+ llmt 12m, 10n,+ 11n, + 12m, 





13k, + 14k, + 15k, 134, + 14 +151, 13m,+ 14m,+ 15m, — 13n, + 14n, + 15n, 











T T 
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最 后 ， 我 再 对 逆 吞 阵 做 一 些 讲解 : 
| am ( 2 men ( 1 就 是 和 ( 3) 

3 4 3 4), 
相反 | emme. 











12|-2 1 1LI1XC2+2x13 1xl+2x(-05)|_|10 
3 4 人 15 -0.5) (3x(-2)+4x1.5 3xl+4x(-05)) 【0 1 


j ae pi ist sj | 




















今天 就 到 此 为 止 吧 。 








































































































































































































& 7. 数值 数据 和 分 类 数据 % 








数值 大 致 可 以 分 为 “可 测量 ”数据 和 “不 可 测量 ”数据 丙种。 其中,“ 可 测量 ” 
数据 被 称 为 数值 数据 (numerical data ),“ 不 可 测量 ”数据 被 称 为 分 类 数据 (category 
data 或 categorial data )。 


数值 数据 和 分 类 数据 在 记录 上 的 具体 差别 如 表 1.1 所 示 。 
OR 1.1 数值 数据 和 分 类 数据 的 具体 实例 




















A ee: ea 性 别 
4 4 20 火车 女 
B 2 19 家 男 
9 10 18 咖啡 厅 男 
D 14 22 图 书馆 女 
数值 数据 分 类 数据 


分 析 者 也 可 以 通过 一 些 方法 将 数值 数据 变换 成 分 类 数据 ， 或 者 将 分 类 数据 变换 成 
数值 数据 。 
数值 数据 变换 成 分 类 数据 的 例子 如 表 1.2 所 示 。 


人 表 1.2 数值 数据 变换 成 为 分 类 数据 举例 


每 个 月 读书 量 每 个 月 读书 量 
( 册 ) (W) 
A 4 少 
B 2 * 
g 10 g 
D 14 g 
E 7 * 





在 变换 时 还 要 注意 ,“ 少 "、“ 中 ”、“ 多 ”之 间 的 分 界线 是 多 少 ， 这 是 需要 分 析 者 
做 出 相应 判断 的 。 
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分 类 数据 变换 成 为 数值 数据 的 例子 如 表 1.3 所 示 。 
く 表 1.3 分 类 数据 变换 成 为 数值 数据 举例 
最 喜欢 的 季节 者 | ale を 








Dawes 
RS ke 





这 里 再 对 分 类 数据 变换 成 为 数值 数据 的 例子 稍 作 说 明 。 对 于 上 表 中 的 变换 ， 在 
实际 操作 中 我 们 一 般 采 用 下 表 的 形式 。 


R14 分 类 数据 变换 成 为 数值 数据 举例 (3 列 ) 
最 喜欢 的 季节 春 夏 秋 








RS eR 


coo 
o-oo 


0 
1 
0 
0 


Dawa 


同样 地 ,例如 我 们 在 变换 “星期 几 ” 时 会 采用 6 列 ,在 变换 “月 份 ”时 采用 11 列 ， 
在 变换 “性 别 ” 时 采用 1 列 。 在 表 1.4 中 ,虽然 我 们 省 略 的 是 表 1.3 中 “ 冬 ” 的 那 一 列 。 
但 是 ,如 果 我 们 不 省 略 “ 冬 ”而 省 略 “ 夏 ”的 那 一 列 也 是 正确 的 。 以 此 类 推 ,省 略 “ 春 ” 
或 者 “ 秋 ” 都 没有 关系 。 

为 什么 特意 省 略 了 一 列 呢 ? 是 由 于 以 下 原因 : 

“如 果 没 有 省 略 其 中 某 一 列 ， 而 直接 使 用 像 表 1.3 那样 的 数据 进行 重 回归 分 析 的 
话 ， 在 数学 上 是 没有 办 法 求解 的 。 

“虽然 省 略 了 一 列 ， 但 是 表达 的 意思 是 一 样 的 (例如 表 1.4 中 的 “ 冬 ” 可 以 通过 
“0-0-0” 进 行 表示 )。 再 进一步 讲 ， 那 一 列 的 存在 本 身 也 是 没有 意义 的 ， 即 便 省 略 了 
也 是 合理 的 。 
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& 8. 离 差 平方 和 、 方 差 、 标 准 差 % 





美 羽 和 理 纱 与 打工 的 同伴 一 起 去 唱 卡拉 OK。 她 们 每 5 人 一 组 ， 分 成 两 组 依据 
演唱 得 分 进行 比赛 。 比 赛 结果 如 表 1.5。 


多 表 1.5 卡拉 OK 的 评分 结果 


















































RPA (得 分 ) 理 纱 组 (得 分 ) 
美羽 48 理 纱 67 
裕子 32 明日 香 55 
愛子 88 奈 奈 61 
真野 61 FJL 63 
真理 惠 71 丽 香 54 
平均 60 平均 60 
将 上 表 画 成 图 便 可 得 到 下 图 。 
美 羽 组 
真理 惠 | 
ik RF 
ee les aT 





He 30 40 50 60 70 rA 90 100 








理 纱 组 

















RR 
明日 香 雪 儿 ] 


me | BY 
errs トー キー キラ 


0 10 20 30 40 50 60 70 80 90 100 





















































图 1.1 卡拉 OK 的 评分 结果 
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虽然 美 羽 组 和 理 纱 组 的 平均 得 分 同 为 60 分 ， 但 具体 的 情况 却 差别 很 大 。 美 羽 组 
这 方 ,每 个 人 的 得 分 是 不 是 分 布 得 很 不 均匀 呢 ? 也 就 是 说 数据 的 “分 散 程度 ”比较 大 。 

人 们 通常 采用 离 差 平方 和 、( 总 体 ) 方差 和 ( 总 体 ) 标准 差 作为 表征 数据 的 “ 离 
散 程 度 ”的 指标 。 这 些 指标 都 具有 如 下 性 质 


。 最 小 值 为 0 
。 数 据 的 “离散 程度 ” 越 大 ， 它 们 的 值 也 就 越 大 


离 差 平方 和 ， 常 常会 出 现在 以 回归 分 析 为 代表 的 多 种 分 析 方法 的 计算 过 程 中 
离 差 平方 和 = (每 个 数据 -平均 值 》 相 加 之 和 
通过 上 述 计算 便 可 求解 出 离 差 平方 和 的 值 。 然 而 数据 的 个 数 越 多 ， 它 的 值 也 就 
会 变 得 越 大 ， 这 也 成 为 它 的 一 个 致命 的 缺点 ， 所 以 在 实际 操作 中 我 们 很 少 使 用 它 作 
为 表征 “离散 程度 ”的 指标 。 
(总 体 ) 方差 ， 解 决 了 离 差 平方 和 的 缺点 。 可 以 通过 如 下 计算 求 得 它 的 值 。 


离 差 平方 和 


(总 体 ) 方差 = ee 


(总 体 ) 标准 差 ， 从 本 质 上 讲 与 (总体 ) 方差 是 相同 的 。 可 以 通过 如 下 计算 求 得 
它 的 值 。 


(总 体 ) 标准 差 = \/( 总 体 ) 方差 


让 我 们 来 求 一 下 美 羽 组 和 理 纱 组 的 离 差 平方 和 、( 总 体 ) 方差 和 ( 总体 ) 标准 














差 吧 ! 
多 表 1.6” 美 羽 组 和 理 幼 组 的 离 差 平方 和 、( 总 体 ) 方差 和 ( 总 体 ) 标准 差 
美 羽 组 理 纱 组 

(48-60)+ (32-60) + (88-60)'+ (61-60)'+ (71—60) | (67-60+(55—60) +(61-60F +(63—60) +(54-60} 
离 差 平方 和 | -CI27+(CL287+28+E+1E PHS + 

-1834 =120 
(总 体 ) 方差 | SE -668 Bou 
(总 体 ) 标准 差 | V3665 = 192 Y54=49 











注 : 在 方差 中 ， 也 有 不 采用 “数据 个 数 ”而 采用 “数据 个 数 -1” 作 为 分 母 的 情况 ， 我 们 将 其 称 为 样本 方差 。 由 于 篇 幅 
所 限 ， 这 两 种 方差 的 区 别 在 本 书 中 就 不 做 讨论 了 。 
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& 9. 概率 密度 函数 を 





画 9.1 X2 分 布 
在 统计 学 中 ， 常 常会 出 现下 面 介绍 的 概率 密度 函数 。 
1 PT ye 
TAK > Aa xx 2 xe? x>0 时 ， 
Dro xf? ed 
/WW= 
0 x<0 时 


如 果 x 的 概率 密度 函数 满足 上 述 条 件 的 话 ， 在 统计 学 中 我 们 就 将 其 表述 为 “x 
服从 自由 度 为 OO 的 た 分 布 "。 

“自由 度 是 什么 ?”"， 这 或 许 会 让 读者 摸 不 着 头脑 。 其实“ 自由 度 是 什么 ”这 个 
问题 就 相当 于 在 问 “ 一 次 函数 /(x)=ax+b 中 的 a 是 什么 "。 所 谓 自由 度 ,不 过 就 是 “ 影 
响 函 数 图 像 形状 的 一 个 值 ”而 已 ， 除 此 之 外 便 没 有 其 他 意义 了 。 

国 自 由 度 为 2 的 情况 








0.4 
03 


02 


0 
0 5 10 15 


BAHEA 10 的 情况 
01 


Y 
8 











0.05 
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在 实际 应 用 中 ， 存 在 一 种 叫做 “总 分布 表 ” 的 表格 。 使 用 这 个 表格 ， 我 们 就 可 
将 与 下 图 中 斜 线 部 分 的 概率 (= 面积 ) 已 相对 应 的 横 轴 坐标 查找 出 来 。 图 中 的 eK 
做 “ 卡 方 ”。 


だ 
下面 是 我 休 芝 逃 的 一 部 分 7 分布 表 。 


CRIT LIBR 





0.995 0.99 0.975 0.95 0.05 0.025 0.01 0.005 








1 0.000039 | 0.0002 | 0.0010 | 0.0039 | 3.8415 | 5.0239 | 6.6349 | 7.8794 
2 0.0100 0.0201 | 0.0506 | 0.1026 5.9915 | 7.3778 | 9.2104 | 10.5965 
3 0.0717 0.1148 | 0.2158 | 0.3518 7.8147 | 9.3484 | 11.3449 | 12.8381 
4 0.2070 0.2971 | 0.4844 | 0.7107 | 9.4877 | 11.1433 | 13.2767 | 14.8602 
5 0.4118 0.5543 | 0.8312 | 1.1455 | 11.0705 | 12.8325 | 15.0863 | 16.7496 
6 0.6757 0.8721 1.2373 | 1.6354 | 12.5916 | 14.4494 | 16.8119 | 18.5475 
7 0.9893 1.2390 | 1.6899 | 2.1673 | 14.0671 | 16.0128 | 18.4753 | 20.2777 
8 1.3444 1.6465 | 2.1797 | 2.7326 | 15.5073 | 17.5345 | 20.0902 | 21.9549 
9 1.7349 2.0879 | 2.7004 | 3.3251 | 16.9190 | 19.0228 | 21.6660 | 23.5893 
10 2.1558 2.5582 | 3.2470 | 3.9403 | 18.3070 | 20.4832 | 23.2093 | 25.1881 





























4 PY 0.05, 自由 度 罰 2 HHR, X WEN 5.9915. 


m92 分 布 
在 统计 学 中 ， 常 常会 出 现下 面 介 绍 的 这 种 概率 密度 函数 。 











aaaaaas ， nae mas 
(p H eva} xen nam (第 2 自由 度 ) > mann 
— 
f= — — —— 
(r z “adrx i era) maamaa r 
0 xS0 時 


如 果 x 的 概率 密度 函数 满足 上 述 条 件 的 话 ， 在 统计 学 中 我 们 就 将 其 表述 为 “x 
服从 第 一 自由 度 为 OO、 第 2 自由 度 为 x x 的 下 分 布 "。 
1 自由 度 为 5、 第 2 自由 度 为 10 的 情況 
07 
06 
0.5 
04 








è 


0 2 4 6 8 





图 第 1 自由 度 为 10、 第 2 自由 度 为 5 的 情况 


0.7 
0.6 
0.5 
04 
03 
02 
0.1 

0 




















0 2 4 6 8 10 
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x>0 时 ， 


在 实际 应 用 中 ， 存 在 一 种 叫做 “F 分 布 表 ” 的 表格 。 使 用 这 个 表格 ,我 们 就 可 
将 与 下 图 中 和 斜 线 部 分 的 概率 (= 面积 ) 已 相对 应 的 横 轴 坐标 查找 出 来 。 


F( 第 1 自由 度 , 第 2 自由 度 , の 
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下 面 是 我 们 节选 的 一 部 分 分 布 表 : 
令 表 1.8 PP 为 0.05 BH FBR 


第 1 自由 度 | 








aren 1 2 3 | 4]s5]6]7 8 | 9 | 10 
1 161.4 | 1993 | 215.7 | 224.6 | 230.2 | 234.0 | 236.8 | 2389 | 240.5 | 241.9 
2 18.5 | 190 | 192 | 192] 193 | 193| 194] 194] 194] 19.4 
3 101 | 96| 93| 91| 90| 89| 89] 88| 88| ss 
4 717| 69| 66| 64| 63| 62| 61| 60| 60| 60 
5 66| 58| s4| 52| si] so] 49| 48| 48] 47 
6 60| 51| 48| 45| 44| 43| 42| 41| 41| 41 
7 56| 47| 43| 41| 40| 39] 38| 37| 37| 36 
8 53| 45| 41| 38| 37] 36| 35| 34] 34| 33 
9 51| 43] 39| 36| 35] 34| 33| 32] 32] 31 
10 50| 41| 37| 35| 33| 32| 31| 31] 30| 30 
1 48 | 40| 36| 34| 32] 31| 30| 29] 29| 29 
12 47 391 33] Y| St 3.0) 29| 28] 28) 28 














R19 PH0.01 RY FSR 
— きる る を る ッッ | sda 
1 | 40522|4999.3|5403.5| 5624.3|3764.0| 5859.0| 59283| 5981.0 
2 98.5| 99.0| 99.2| 993| 99.3] 99.3| 99.4| 994 
3 34.1| 30.8| 29.5| 28.7| 28.2| 27.9| 27.7| 27.5 
4 21.2 18.0| 16.7| 16.0| 15.5| 15.2| 15.0| 148 
J 16.3 13.3| 12.1 11.4| 11.0| 10.7| 10.5) 103 
6 13.7 10.9 9.8 9.1 8.7 8.5 83 8.1 8.0 719 
7 12.2 9.5 8.5 7.8 75 72 7.0 68 6.7 6.6 
8 11.3 8.6 7.6 7.0 6.6 64 6.2 6.0 39 58 
9 10.6 8.0 7.0 64 6.1 5.8 5.6 5.5 54 53 
10 10.0 76 6.6 6.0) 5.6 54 52 5.1 49 48 
u 9.6 72 6.2 5.7 53 5.1 49 47 46 45 
12 93 6.9 6.0 54 5.1 48 46 45 44 43 
aD 


当 P 为 0.05、 第 1 自由 度 为 1、 第 2 自由 度 为 12 的 时 























自由 度 , 第 2 自由 度 ; P)， 即 F(1，12; 0.05) 的 值 为 4.7。 
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候 , 也 可 以 记 作 严 ( 第 1 


















































看 着 那 一 对 在 想 什么 呢 ? 对 不 起 …… 












































今天 我 们 来 学 习 你 
期 待 已 久 的 回归 分 
HE! 








AAR AAR KAT 
Rl BoA RH 
销售 量 ”总 结 出 来 的 。 


是 老板 告诉 我 的 。 
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50 s a j 
20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 


最 高 气温 (C ) 












































我 们 先 不 讲 如 何 计算 ， 只 须 
知道 “最 高 气温 ”和 “ 冰 红 茶 
的 销售 量 ” 的 单 相关 系数 的 什 
是 0.9069。 


W 单 相关 系数 = 0.9069 


因为 2 个 变量 的 关联 程度 越 
大 ， 其 单 相关 系数 的 值 就 越 
接近 士 1， 所 以 我 们 就 可 以 说 
它们 的 关联 程度 相当 大 。 





所 以 ， 天 气 越 执 
越 好 卖 哟 1 





也 是 啊 ， 不 过 如 果 这 些 
数据 仅仅 是 用 来 求 单 相 
关系 数 的 值 ， 那 就 太 没 
有 意义 了 。 


RTA, OB 
DME BS | 






































RAR 
人 


















































就 可 以 根据 最 高 
气温 来 预测 冰 红 
茶 的 销售 量 啦 ! 











哇 ! 那 要 如 何 S) 


ERR 
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被 称 为 “回归 方程 。 





(JUREN X 
(JUREN 


る Sa る きる 


100 
% 
% 
& 
$0 
* 
见 
& 
0 
5$ 
So 


DU NBAB HMB D32 BAS DU LBABHNWHHI RAT 
最 高 气温 (C ) 最 高 气 湿 (C ) 


我 们 如 果 将 不 同 的 工 值 


不 就 可 以 预测 出 
在 多 少 民 的 时 候 
卖 出 多 少 杯 了 吗 ? 


24 15 26 2728 79 30 
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怎么 觉得 回归 分 析 
看 起 来 这 么 简单 。 


Es 请 尽快 枚 我 回归 
Es 


HRY Si 
pied 


pe 


做 回归 分 析 呢 ， 并 不 
是 说 求 出 回归 方程 就 


有 时 要 确认 回归 方程 的 
精度 ， 有 时 要 推测 总 体 


的 情况 …… 
有 各 种 各 样 需要 去 做 的 
Fh. 

















& 2. 回归 分 析 的 实例 & 回归 分 析 的 流程 是 
这 样 的 1 






























@ 进行 回归 系数 的 检验 。 








O 首先 ， 为 了 讨论 是 否 具有 求解 回归 方程 的 意义 ， 
画 出 自 变量 和 因 变 量 的 散 点 图 。 
> 
garb 
@ 求解 回归 方程 。 K 
X 
ーー で と 
neal 
@ 确认 回归 方程 的 精度 。 9 
—— 








© 总 体 回归 Ax+B 的 估计 。 
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LE OESE E aas 


EJ 



















































































这 就 是 全 部 了 吗 ? / D 





























\ ー ク 
\ AM, AAT, 
g \ A 分 析 也 就 结束 了 。 





那么 ， 就 让 我 们 用 诺 伦 
的 数据 做 一 次 实际 的 回 
归 分 析 吧 ! 


这 个 以 后 再 给 你 
EREE! 











① 首先 ， 为 了 讨论 是 否 具 有 求解 回归 方程 的 意义 ， 画 出 自 变 量 和 
因 变量 的 散 点 图 








先 画 出 自 变量 和 因 变 重 的 RAMONE 
KAB! ARSE, 
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从 这 些 数据 看 来 

“ 景 高 气温 ”和 “ 冰 红 茶 
的 销售 量 ” 具 有 很 强 的 相 
关 性 。 


单 相关 系数 的 值 ， 也 要 比 
实际 的 0.9069 略微 大 一 


可 以 说 是 具备 求解 回归 方程 的 
意义 ! 


坦 门 来 做 这 样 的 
事情 有 必要 吗 ? 





まき さき 


* 
き 
$ 
$ 
è 
# 


た 
tazas 


2 











es 
ee 





bon nD Was nswnns ns 
amao 


看 看 这 个 ， 从 给 出 的 数据 来 
看 ， 这 两 个 变量 怎么 看 也 不 像 
是 相关 联 的 …… 


但 是 从 数学 上 ， 仍 然 可 以 求解 
出 基本 的 回归 方程 1 
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@ 求解 回归 方程 


那么 接 下 来 1 我 就 要 
求解 回归 方程 路! 


它 的 计算 过 程 ， 包 含 
以下 6 ADR: 








Bl yeaa) 











100 
% 
% 
& 
0 
* 
w 
6 
し 
5$ 
5 


在 图 中 这 些 坚 线 长 度 
的 平方 之 和 达到 最 小 
时 , Rik a fob, 


* 
红 
Z 
$ 
を 
ã 
に 


BHMBWA HI RAT 这 种 思考 方法 就 是 
RRES (C) 所 谓 的 “最 小 二 来 
法 "。 


求 x 的 离 差 平方 和 Sx 与 的 离 差 平方 和 Sw 以 及 
XIN) BERS, DS Su, Sire 


GED tarre. 
— 
GD と も うー 


、 ED mease. 


ED «tows. 
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那么 就 从 步骤 1 开始 
按照 顺序 往 下 做 吧 ! 


. 求 出 x 的 离 差 平方 和 5, AMAL 
ORI y 的 离 差 平方 和 S, 的 值 
. 求 出 x 和 ?的 离 差 可 和 S, 的 人 


26H (di) 
27 日 和) 
28 日 (日 ) 
29 日 (一 ) 
30 日 二 ) 
31 日 (三 ) 
1 日 (四 ) 
2 日 五 ) 
3 日 (六 ) 
4 日 (日 ) 
总 计 
平均 
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CE》 下 硬 给 由 的 是 具 休 的 运算 过 入 


表 中 “ty” 


j=ax+b 


叫做 实测 值 。 
”叫做 预测 值 。 


“yj” MARE, HH “e” KRR 


22 日 一 ) 
23H (=) 
24H (=) 
25 日 四 ) 
268 (Ti) 
27H (5) 
28H (H) 
29 日 ご) 
30H 


1 日 (四 ) 
28 Ci) 
3H (A) 
4H (A) 


ax29+b 
ax28+b 
ax34+b 
ax31+b 
ax25+b 
ax29+b 
ax32+b 
ax3l+b 
ax24+b 
ax33+b 
ax25+b 
ax31+b 
ax26+b 
ax30+b 


11-(ax29+5) 
62-(ax28 +b) 
93- (ax34+b) 
84-(ax31 +b) 
59- (ax25+b) 
64-(ax 29 +5) 
80-(ax32+b) 
15- (ax31 +b) 
58- (a x 24+ b) 
91- (ax 33 +b) 
S1- (ax 25+) 
3-(ax31+b) 
65- (ax 26 +b) 
84- (ax 30+) 


[77-(ax 29+ b)? 
[62- (a x 28+ DF 
[93 - (a x 34+ DF 
[84- (a x31 +b)? 
[59 - (a x 25 + b)}? 
[64 - (a x 29 + b)}? 
[80- (ax 32+ b)? 
[75-(ax31 +b)? 
[58 - (a x 24 + b)? 
[91 -(ax 33+ 5)P 
[51 - (a x25 +b)? 
[3-(ax31 +b)? 
[65 — (a x 26 + DF 
[84 — (a x 30 + b)? 





总 计 
平均 





408a+ 14b 


1016 - (408a + 14b) 





29.1a+b 
=Xat+b 








[72.6 - (29.1a + b) 





= ター(Gg+ が 


我 们 将 上 表 中 的 (yj)? 值 逐 列 相 加 ， 也 就 是 将 e 相 加 ， 
将 其 称 为 “ 残 差 平方 和 "， 一 般 用 Se 表示 。 
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人 对 残 兰 平方 和 AT a 和 0 求 微分 ， 并 使 其 为 0。 


图 ”对 a 微分 
Ea [77- (29a + b)] x (-29) + + + 2 [84 (30a + b)] x(-30) =0 


对 1 微分 


feo (77 — (29a + b)] x (-1) + -=+ + 2 [84 — (30a + b)] x (1) =0 -= © 


GD 对 步骤 3 的 D 和 @ 进 行 整 理 


E 整理 ① 式 
2[77 (29a + b)] x (-29) + :++2[84— (30a+D)] x (-30) =0 


[77 - (29a + b)] x(-29)+…+ [84 — (30a + b)] x(-30) =0 O mamaaa, 
29[(29a + b) - 77] +… + 30[(30a + b) - 84] =0 ERIE, EAE 
(29x 29a +29 x b= 29x 77) + == + (30 x 30a +30 x b — 30 x 84) =0 


(29 + + 30a + (29 + +++ +30)b — (29 X77 + -= +30 x84) =0 -= @ 


E 整理 ② 式 
2[77- (29a + b)] x(-)+…+2[84 — (30a + b)] x (-1) =0 


[77- (29a + b)) x (-1) + =- + [84- (30a + b)) x (-1) =0 ーー De 
【294+ の -77]+…+ [GOq+ の -84] =0 下 


(29+…+30)g+ り +… キ ムー(77+…+84 =0 


(29+…+30)g+145-(77+…+84)=0 


14b = (77 + + 84) — (29 + + +30)a ee 
29+… 
2 0 aT 
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人 HRs PHORAL Rs HHO. 


OS ++ +30)a H29 + + -+20( 


(29 +++ + 30) a 





QS ++ +30) 


(29° + +30) 


9+…+30)77+…+84) _ 294 +30)" 














Ft 
= + 


= (9 + 


++84 29+…+30 
这 +30x84)=0 


Te a a— (29X77 + +30 84) =0 


(29 +- +30) (29 + ++- + 30)(77 + -> + 84) 
(29 + = +307 29+…+30)77+…+84) 
ee BAA 


= 09 4 +30) -2x09 += +30) xE + (YX 14 — 


= = +30) x 


3 (29°=2x29xE+ (FN] +… 十 [30 一 2X30X 天 + (元 门 
= (29-3) +- +0-2) 


=s 


整理 右边 


29x77+… 


=29x77+ 
=(29x77+ 


=(9x7T+… 


=(C9x7I+… 


=(29x77+ 
=(29 x77+ 





+30 x 84) — 2 


43084) OE AION + + 84) 


+ー+30 77+…+84 
T x x14 


-+30x84) xyx14 


-+30x84-3x5x14-3x5x 4+ 3x 5x 14 · 


+430 


29 7+…+84 
+30x0- ニ ーーー xyxi14-*x ーー オー X14+ テ xyx14 


= 2977 299-7142 x5) + + (30x 84 — 30y 84F +X) 
= (29-377 -)+…+(30-3(84- 


=S, 
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GD keane: 


根据 步 又 5 中 的 @ 可 知 ， an 。 根 据 步 又 4 中 的 ⑤ 可 知 , b=y-xXa, 
因此 ,根据 步骤 1 可 知 


b=7- 积 =72.6-29.1x3.7=-36.4 


所 以 ， 回 归 方程 为 


』 


00 
% 
% 
的 
57 
路 
mg 
な 
u 
站 
名 


不 仅仅 限于 这 个 例子 ， 凡 是 求 回归 方程 
的 a 和 的 值 ， 都 可 以 做 如 下 计算 。 


x Foy HRS Re Sy 


“TX BRET a 。 Ss 


站 
红 
* 
的 
销 
售 
量 
杯 





20 21 R 2 24 15 2% 2728 7 031 ZBWB 


回归 方程 是 
y=3.7x-36.4 
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虽然 这 个 与 计算 
H, $A, kŠ 没有 直接 关系 ， 
气温 和 冰 红 茶 的 但 由 于 比较 重要 
销售 量 的 平均 值 所 以 和 要 先 说 明 一 
分 别 是 多 少 ? 7 


one ae SET HC 


(RN 


i 
WUR B AI 278 H D3! ZRH 
ズ 最 高 温 变 (C ) 


RINN 

bAN wy EF GARR 

/ a 经 过 点 ( 了 )。 
29.1 和 72.6。 


= 47+(¥-Xa) 
= 4⑦- え リィ タ 


= 2⑦-) ナ ダチ 


= Q(A-4)4G 
Ax0tyY 











HEZO 


@ 确认 回归 方程 的 精度 

















刚刚 求 出 的 回归 方程 。 根据 座 构 的 数据 求 出 的 回归 方程 。 






























20 21-22 23-246 25 26 27 29 30 31 32 33 M35 
asaro 











RAH, Lie 
中 ， 点 和 回归 方程 更 加 吻 
合 一 芝 . 
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像 这 样 ， 我 们 把 左 不 过 ， 以 看 图 的 方式 来 
图 中 点 和 回归 方程 判断 精度 ， 毕 况 还 是 有 
吻合 得 好 的 情况 ， 些 主观 ， 你 说 对 吗 ? 
就 叫做 “回归 方程 

的 精度 较 高 ”或 者 

“ 拟 合 度 较 好 "。 

















这 下 该 轮 到 “ 重 相关 系数 ” 
出 场 了 1 


而 重 相关 系数 说 起 来 
就 像 单 次 测量 值 和 
预测 值 了 的 单 相关 系 


回归 方程 的 精度 就 是 用 来 表示 点 和 回归 方程 
拟 合 程度 的 指标 。 
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Aoi BRIO _ Sy _ l8l23 
(YOREF Sb x REPS VA V2203.4x (812.3 








| の - が | 0-97 
-2.4 24.6 
45.2 39.7 
370.9 52 
25A (m) : 793 201 
268 (5) 210.2 37 
278 (5) I 46 64.6 
288 (B) 79.3 10.6 
298 (-) ? ? : 169 204 
308 (=) 280.1 21.6 
318 (=) 265.7 16.1 
18 四 ) 334.0 37.0 
28 (5 . ? : 5 30 424 
38 (A) 88.9 17.4 
48 (B) f 36.6 67.6 
总 it 1812.3 | sl 
平均 









































重 相关 系数 尺 的 计算 虽然 与 S。 没有 
关系 ， 但 是 对 之 后 的 运算 很 重要 ， 
所 以 要 先 求 出 来 。 
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我 们 将 (ERZA) j 
MAA RAR. — 
Naa 


平方 以 后 名 字 就 
= 


通常 ， 记 作 “R”。 
我 是 重 相 我 是 重 相 
aR KaR 


判定 系数 R 的 取 值 范围 是 IR HRA A 
0 到 1。 多 少时 ， 我 们 就 可 
以 说 精度 高 呢 ? 





回归 方程 的 精度 越 高 ，R? 的 什 ee ; 
越 接近 |, RZ, WRIRIE 0。 TERETI. * 


但 是 ， 将 “0.5 以 上 " 
做 为 一 个 指标 也 是 可 


R= (0.9069) 
= 0.8225 
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BRST sa SROR SD 


这 可 不 止 是 0.5 以 上 了 
A, CBR BLT. 
所 以 ， 可 以 说 我 们 求 
出 的 回归 方程 具有 很 


GD weesmTe 





DURBBABRABAHI VBR¥ 
ae 


为 了 节省 时 间 ， 这 里 
就 不 作证 明了 。 不 过 ， 
这 样 的 关系 可 是 成 立 
的 哟 1 





76 第 2 章 回归 分 析 


我 们 再 来 看 一 下 
anaes 比如 说 ， 最 高 温 
度 为 31C 的 日 子 

出 现 过 几 次 ? 





4, 25A, 29 


日 和 2 日 ， 一 
*34 A 











BRAKE, WA 
这 样 。 


— 以 前 有 很 多 这 种 情况 ， 
Y —ã— — — TERNAN 


还 真是 
那样 的 啊 ! 








- 物 销 售 量 相同 的 
Pears tr 
ELTEL 


25 日 、29 日 和 2 日 应 当 说 是 从 "最 
高 气温 为 31C 的 日 子 " 这 样 的 总 体 
中 随意 抽出 的 三 天 。 









G> 
so 


や 
aS è 
其 他 的 日 子 也 
这 样 做 吧 ! 
し 


と KS a Ni 
我 明白 所 谓 的 总 体 AN; 
是 怎么 一 回 事 了 。 > 3 | 
TO 好 样 的 ! RAN 
>) 继续 吧 ! 
NX 


78 82% GASH 






如 果 要 做 回归 分 析 ， 
那么 有 一 个 假设 
是 要 严格 成 立 的 。 


"最 高 气温 为 x"C 那 天 的 冰 红 共 销 信 量 ” 
服从 平均 值 为 人 x+B、 标 准 卷 为 呆 的 1 



















符号 的 含义 以 后 再 解 
看 一 下 这 个 假设 1 







总 之 ， 对 于 “最 高 气温 为 xD 那 
天 的 冰 红 茶 销 售 量 ”的 正 态 分 布 
ARH, txiz, M 
形 都 是 完全 一 样 的 。 


记 住 ， 无 论 冷 热 正 态 分 布 的 
图 形 都 是 相同 的 ， 这 是 不 需 
要 任何 解释 的 ， 是 回归 分 析 


这 样 说 的 话 ， 是 不 是 
就 可 以 想 通 了 ? 
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图 进行 “回归 系数 的 检验 ” 


说 到 4、B 还 有 o， 统 
计 学 上 常常 会 用 到 它们 


8, 回归 方程 是 
y=3.7x-36.4。 





证 明 过 得 比较 国难 
所 以 就 不 讲 了 …… 





在 刚刚 求 出 的 回归 方程 シ =ax+b 中 
“大 约 为 0 
"日 约 为 D 


Se 
He Hn rete 








是 这 样 吗 ? 
就 是 这 样 ! 
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的 手段， 
无 法 严格 地 计算 出 4、B 和 
值 . 




















AiR 


无 论 如 何 
都 不 能 等 于 0 的 ”! 





























因为 , 要 是 4=0 HH, 
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BRA a // 
— T RAEI p. 
BAFA o WERON, 


A=0 
# 







这 样 无 论 最 高 气温 是 多 少 ， 我 们 都 可 以 
断定 冰 红 茶 的 销售 量 是 相同 的 。 


那 、 要 怎么 做 才 可 那么 ， 我 们 就 以 “0.05” 作 为 
以 知道 4 是 否 等 于 有 意义 的 标准 ， 来 具体 地 做 一 
0%? 


@ 


“回归 系数 的 检验 ”| 


所 以 ， 就 要 进行 
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定义 总 体 。 


以 “最 高 气温 为 xYC 的 日 子 ” 作 为 总 体 。 





建立 原 假设 和 备 择 假设 。 


原 假设 为 “4= 0"。 
备 择 假设 为 “4 0"。 





选择 所 要 进行 的 “检验 ”类 型 。 


进行 “回归 系数 的 检验 ”。 





设 定 有 意义 的 标准 。 


以 0.05 为 有 意义 的 标准 。 





通过 样本 数据 求 出 检验 统计 量 的 值 。 


下 面 进行 “回归 系数 的 检验 ”。 
所 谓 “回归 系数 的 检验 ”的 检验 统计 量 的 值 为 
ど S. 
+ 
-1 个体 个 数 -2 
Sa 
所 以 在 本 例题 中 ， 检 验 统计 量 的 值 为 
37 3911 _ 556 


+ 
( 1 } 14-2 
129.7 


在 本 例题 中 ， 如 果 原 假设 成 立 ， 那 么 检验 统计 量 就 
服从 第 1 自由 度 为 1、 第 2 自由 度 为 12 (= 个 体 个 
数 -2) 的 分 布 。 





再 将 步骤 5 中 求 出 的 检验 统计 量 的 
值 所 对 应 的 己 值 ， 与 有 意义 的 标准 
进行 比较 ， 看 看 PRUE A HI), 


有 意义 的 标准 是 005。 检 验 统计 量 的 值 为 55.6， 所 
以 P 值 为 0.000008。 
0.000008<0.05， 所 以 P 值 小 。 





如 果 在 步骤 6 中 己 值 比 有 意义 的 标 
准 小 ， 则 我 们 就 可 以 得 出 “ 备 择 假 
设 成 立 ” 的 结论 。 反 之 ， 我 们 就 可 
以 得 出 “ 原 假设 成 立 ”的 结论 。 





与 有 意义 的 标准 相 比 ,，P 值 小 。 所 以 ， 备 择 假设 “4 
天 0” 成 立 。 





有 些 参考 资料 中 ， 不 是 依据 
下 分 布 而 是 依据 1 分 布 来 讲 
解 “回归 系数 的 检验 "。 

这 个 问题 从 数学 的 角度 解释 
起 来 比较 困难 ， 所 以 我 们 不 
做 详细 介绍 。 但 是 ， 无 论 依 
据 哪 种 分 布 ， 其 最 终 的 结论 
都 是 相同 的 。 
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党 严 分 布 中 尸 值 的 求解 方法 请 参见 第 204 页 。 





将 “ 某 个 值 以 上 、 某 个 另外 ， 我 们 将 估算 出 的 
值 以 下 ”的 估算 过 程 称 Eller "重信 区 同 "。 


为 “区 间 估计 "。 也 就 是 说 ， 所 谓 的 “一 定 


会 的 可 靠 程度 指 的 就 是 ' 置 
信 度 "置信 水 平 ” 或 “置信 
系数 


置信 度 并 不 是 在 求 出 置信 在 刚刚 的 31YC 的 例子 中 ， 实际 上 并 不 是 说 总 
区 间 后 判断 出 来 的 。 体 回归 4X31+ 有 "一 定 会 " 位 于 “ 某 个 值 以 上 、 
EMRAT”, 


实际 上 ， 它 是 在 求解 置信 区 

间 之 前 , 由 分 析 者 自己 "决定 ” 而 应 当 说 ， 当 置 信 度 为 〇 JC) % 时 ， 总 体 回归 
AX31+B 应 该 位 于 “ 某 个 值 以 上 、 某 个 值 以 下 ” 
的 区 间 内 。 


设 定 为 DO % 吧 | 
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KR, RH IM 不 是 更 


置信 和 度 可 以 
选择 95% 或 


那么 ， 你 来 求 一 下 ， 置 信 度 为 
95% 时 的 总 体 回归 4X31+B 
的 置信 区 间 吧 ! 


HORACE KE 


会 是 0 一 120 杯 ， 
N320 


sew eee 
概 40 ~ 80 杯 , 
gh 95% 4 \ 避 本 不 会 有 钳 | 








那样 就 会 导致 置信 区 间 变 长， 
也 就 没有 说 服 力 了 。 
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当 置 信 度 为 95% 的 时 候 ， 总 体 回归 4X31+8 的 置信 区 间 
如 下 : 


79.5-3.9=75.6 ax314b 295439 こ 834 ~ 区 多 全 


=3.7X31-36.4 
=79.5 





SERRA 99% 的 时 候 ， 总 体 回归 4AX31+B 的 置信 区 间 
只 需要 将 F(1， 样 本 个 数 -2; 0.05)=F(1, 14-2; 0.05)=4.7 
的 部 分 变 成 F(1， 样 本 个 数 -2; 0.01) = F(1, 14-2; 0.01) = 93 


党 关于 (1.14-2:0.05)=4.7 等 的 介绍 ， 请 参见 第 54 页 。 


在 置信 度 为 95% 时 ， 总 体 回归 
AX314B 处 于 76 杯 以 上 、83 
杯 以 下 是 这 样 的 吗 ? 
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那么 ， 明 天 的 冰 红 茶 的 
销售 量 会 是 多 少 呢 ? 











刚刚 求 出 的 回归 方程 
A y=3.7x-36.4 所 以 












| 但是 ， 突 际 的 销售 量 真 的 
| 会 刚好 64 杯 吗 …… 





有 一 个 好 方法 罗 ! 


统计 学 中 ， 在 置信 和 度 为 
OO % RAF, 最高 
气温 为 27 那天 的 冰 红 
EMRE, SRT OK 
个 值 以 上 、 某 个 值 以 下 
还 记得 吗 ? 


Ait, BRIAR AR 
的 值 是 0.8225 那 总 会 
是 64 杯 左右 吧 …… 


刚刚 所 讲 的 对 

"总 休 回归 " 4X31+B 的 估计 
现在 就 可 以 说 成 是 对 
最 高 气温 为 27 世 那天 的 冰 红 
茶 销 售 重 ”的 预测 。 
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对 于 总 体 未 说 ， 我 们 考虑 的 N DE- a 对 于 将 来 来 说 ， 我 们 考 让 的 
是 如 何 进行 “估计 是 扣 何 进行 “预测 "…… 


我 们 将 预测 出 的 区 间 称 为 

TARN Re, MAH RA 
的 村 程度 指 的 是 “ 轩 信 
RUA 或 "重信 
Aw 


和 总 体 回归 的 估计 


— 在 相同 置信 度 、 


相同 工 值 的 情况 
下 ， 预 测 区 间 的 
宽度 会 被 设计 得 
完 一 些 。 


计算 方法 也 十 分 相似 ， 
但 是 有 一 些 细 役 差别 。 








当 置 信 度 为 95% 的 时 候 ，" 最 高 气温 27YC 那 天 的 冰 红 茶 销 
售 量 ”的 预测 区 间 如 下 : 





— — 


64.6-13.1 =51.5 aX274b 646+131=777 NE 
=3.7X27-364 
=646 











刚刚 的 计算 中 ， 没 有 处 理 好 四 含 五 入 的 关系 。 事实 上 ， 最 
高 气温 为 27 那天 的 冰 红 茶 销 售 重 ， 不 是 64 而 应 当 是 
64.6 ~ 65 o 


通常 ， 在 区 间 的 预测 和 之 前 所 讲 的 总 体 回归 的 估计 过 程 
中 ， 是 根据 1 分 布 而 不 是 玉 分 布 进行 的 。 这 个 问题 从 数 
学 的 角度 解释 起 来 比较 困难 ， 所 以 这 里 我 们 就 不 做 详细 
介绍 了 。 





总 之 ， 最 高 气温 为 27 人 的 时候， 
冰 红 茶 销 售 量 在 置信 度 为 95% 的 
RAF, 会 处 于 52 杯 以 上 、78 杯 
以 下 对 吧 ? 
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我 已 经 学 会 如 何 
做 回归 分 析 了 ! 


通过 诺 伦 的 数据 ， 真 的 | 
学 到 了 很 多 东西 / 


这 个 ， 有 点 言 之 过 早 了 吧 ， 
还 要 及 时 复习 啊 ! 








& 3. 回归 分 析 过 程 中 的 注意 事项 灾 








下 图 中 ,我 们 再 次 给 出 62 页 中 出 现 的 回归 分 析 的 过 程 : 





① 首先 ， 为 了 讨论 是 否 具有 求解 回归 方程 的 意义 ， 画 出 自 变 量 和 因 变 量 的 散 点 图 。 
1 


回 求解 回归 方程 。 
— 
— “回归 系数 的 检验 ”。 
— Ax+B 的 估计 。 
— 








图 2.1 回归 分 析 的 过 程 


此 前 ,我 们 的 讲解 中 讲 到 ， 必 须 完成 上 图 中 的 第 步 到 第 @ 步 ， 但 事实 上 并 非 
如 此 。 本 系列 的 《漫画 统计 学 》 中 曾 提 到 ， 统 计 学 大 致 可 以 分 为 两 类 : 

,推断 统计 学 

,描述 统计 学 
那么 ,请 再 回想 一 下 ,在 25 页 出 现 的 “ 美 羽 的 年 龄 和 身高 ”的 例子 中 ， 

* 美 羽 只 是 世界 上 广大 人 群 中 的 一 员 。 

・ 美 羽 10 岁 时 的 身高 137.5cm 也 只 是 其 中 的 “一 个 值 ”。 

基于 以 上 两 个 事实 我 们 可 以 知道 ， 像 “ 美 羽 10 岁 时 的 身高 服从 平均 值 为 4x+B、 
标准 差 为 c 的 正 态 分 布 ”等 这 类 的 问题 ， 已 经 没有 思考 的 余地 了 。 就 是 说 ， 像 求解 
总 体 回归 4x+8 的 置信 区 间 ， 以 及 检验 4 + 0 是 否 成 立 这 类 问题 ， 从 推断 统计 学 的 
观点 来 看 ， 已 经 没有 必要 再 进行 分 析 了 。 总 之 ， 就 是 应 当 以 描述 统计 学 的 观点 出 发 
进行 分 析 。 

综 上 所 述 ， 上 图 中 的 第 〇 D 步 做 到 第 @ 步 是 必须 要 做 的 ， 请 尽量 掌握 。 但 是 ， 如 
果 遇 到 像 “ 美 羽 的 年 龄 和 身高 ”这 类 的 情况 ， 也 就 是 应 当 从 描述 统计 学 的 观点 出 发 
进行 分 析 的 情况 时 ， 分 析 过 程 只 需要 进行 第 @ 步 做 到 第 @ 步 。 当 然 如 果 必 要 的 话 ， 
第 @ 步 也 是 要 进行 的 。 
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& 4. 标准 化 残 差 灾 





实际 应 用 中 ,我 们 还 会 遇 到 标准 化 残 差 这 一 概念 。 所 谓 标准 化 残 差 就 是 
FELRE -> _ -_ デラ 
残 差 平方 和 Se 
1 样本 个 数 -2 | FEM 
下 表 中 记录 的 是 本 章 例子 中 的 标准 化 残 差 。 
R21 ”本 章 例子 中 的 标准 化 残 差 

















最高 気温 | 冰 红 茶 的 冰 红 茶 的 RÉ 
(て ) 销售 量 ( 杯 ) 销售 量 ( 杯 ) 
x y 3=3.7x-364| y-f 
22 日 一 ) 29 7 720 50 
23 日 ご ) 28 62 68.3 63 
24 日 三 ) 34 93 907 23 04 
25 日 (四 ) 31 84 79.5 45 08 
26 日 五) 25 59 57.1 19 03 
27 日 (六 ) 29 64 2.0 -80 -14 
28 日 (日 ) 32 80 833 -33 -06 
29 日 一 ) 31 75 795 35 -08 
30H( ご ) 24 58 533 47 08 
31 日 三 ) 33 91 87.0 40 07 
1 日 (四 ) 25 51 57.1 -641 -11 
2 日 五) 31 B 79.5 -65 -Ll 
3H) 26 65 60.8 42 0.7 
4 日 (日 ) 30 84 158 82 14 





标准 化 残 差 的 绝对 值 大 的 个 体 ， 被 看 成 与 其 他 的 个 体 性 质 不 同 。 当 绝对 值 大 于 
3 的 个 体 存在 时 ， 应 将 其 剔除 之 后 再 进行 回归 分 析 。 
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oe 5. 内 插 法 和 外 插 法 客 





下 面 我 们 再 次 给 出 由 本 章 的 例子 所 推导 出 的 回归 方程 。 
OR22 “最 高 气温 ”和 “ 冰 红茶 销售 量 ” 
最 高 气温 | 冰 红 茶 销量 








(©) ( 杯 ) 
22 日 一) 29 77 
BEZ) 28 62 
24 日 三 ) 34 93 
25 日 四 ) 31 84 
26H (Hi) 25 59 
27 日 AN) 29 64 
28H(H) 32 80 
29 日 一 ) 31 75 

24 58 

33 91 
1 日 四 ) 25 si 
2 日 (お ) 31 B 
3 日 AN) 26 65 
4 日 (日 ) 30 84 








和 4 
Re 最 高 气温 

从 上 表 中 可 以 看 出 ， 自 变量 “最 高 气温 ”的 最 小 值 是 24 て, 最大 値 是 34 て 。 

实际 应 用 中 ， 我 们 还 会 遇 到 内 插 和 外 插 的 概念 。 所 谓 的 内 插 ， 以 上 表 为 例 ， 就 
是 将 24 て 以上 井 且 34 亿 以 下 的 值 代入 回归 方程 ， 进 而 来 预测 冰 红 茶 的 销售 量 。 所 谓 
SHA, MERAH, H 24 て 以下 或 者 34 所 以 上 的 值 代入 回归 方程 ， 进 而 来 预测 冰 红 
茶 的 销售 量 。 

在 使 用 外 插 法 时 ， 一 定 要 注意 以 下 情况 。 例 如 ， 在 预测 “最 高 气温 为 18 时 冰 
红茶 销售 量 ”的 时 候 ， 我 们 将 18 代入 回归 方程 中 的 x， 自 然 就 可 以 求 出 结果 。 预 测 
区 间 也 可 以 根据 第 92 页 的 计算 方法 求 出 结果 。 但 是 ， 这 些 值 和 区 间 是 否 可 信 ， 并 不 
能 够 从 数学 上 得 到 证 明 。 
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在 实际 操作 中 ,用 到 外 插 法 的 情况 也 不 少 。 对 笔者 本 人 来 说 ,只 要 不 是 学 术 研究 ， 
觉得 “也 许 无 需 这 么 较真 "， 那 么 使 用 外 插 法 也 是 可 以 的 。 话 虽 如 此 ， 但 是 和 自 变量 
的 最 小 值 或 最 大 值 相差 太 远 的 值 ， 使 用 外 插 法 还 是 被 认为 不 太 可 靠 。 





& 6. 序列 相 英 & 








在 本 章 的 例子 中 ， 是 将 “最 高 气温 ”作为 自 变量 的 。 那 么 请 您 想 一 想 ， 某 天 的 
最 高 气温 是 30Y ， 而 第 二 天 突然 下 降 了 20Y ， 这 种 情况 似乎 不 大 可 能 。 通 常 ， 要 花 
上 几 天 的 时 间 ， 气 温 才 能 渐渐 地 降下 去 或 者 升 上 来 ， 而 相应 的 因 变 量 “ 冰 红茶 的 销 
售 量 ”也 只 能 渐渐 地 随 之 变化 。 

有 些 数据 会 随时 间 的 经 过 而 或 多 或 少 地 受到 影响 ， 对 这 类 数据 的 分 析 ， 我 们 称 
为 “序列 相关 "。 遇 到 这 样 的 问题 ， 最 好 先 确认 一 下 相 邻 残 差 之 间 的 关联 程度 。 有 时 
序列 相关 也 称 为 自 相 关 。 

通常 ， 我 们 使 用 Durbin-Watson 统计 量 作为 衡量 序列 相关 程度 的 指标 。 可 以 经 
过 以 下 计算 求 得 。 

相 邻 残 差 的 差 的 平方 之 和 

各 残 差 的 平方 之 和 
如 果 这 个 值 在 2 左右 ， 那 就 说 明 不 存在 序列 相关 ， 也 就 是 说 没 问题 。 

在 本 章 的 例子 中 ， 可 以 求 得 其 Durbin-Watson 统计 量 为 如 下 : 

(-63-507+23-C 634-482-437 

5.0?+ (6.3) + = + 8.22 = 
这 个 值 接近 2， 所 以 可 以 说 不 存在 序列 相关 。 


Durbin-Watson 统计 量 = 





帘 7. 直线 以 外 的 回归 方程 & 





在 第 60 页 中 ， 





所 谓 回归 分 析 ， 就 是 求 出 被 称 为 回归 方程 的 


y=axtb 


的 一 种 分 析 方 法 。 





需要 说 明 一 点 ,实际 上 ,所 求 的 回归 方程 并 不 一 定 是 y=ax+b 这 样 的 “直线 ”, 例 如 ， 
还 有 如 下 形式 : 


・y=alogx+b 


以 上 这 些 形式 都 是 可 以 的 。 实 际 上 ， 第 26 页 出 现 的 美 羽 “年 龄 ”和 “身高 ”的 
回归 方程 ， 并 不 是 y=ax+b 的 形式 。 MUR y-L+b 的 形式 。 


应 当 使 用 哪 种 函数 类 型 来 求解 回归 方程 。 这 要 根据 分 析 者 自己 的 判断 进行 选择 。 
基本 上 ， 按 照 以 下 的 顺序 进行 判断 较为 合理 。 


© 夯 出 自 变量 和 因 变 量 的 散 点 图 。 
⑫ 使 用 和 散 点 图 形式 相近 的 函数 类 型 求解 回归 方程 ， 例 如 在 第 26 页 的 例子 中 ， 


y= 2 +b 和 y=alx+b 都 符合 ， 那 就 两 个 都 用 ， 将 能 求 出 来 的 都 求 出 来 。 


O 在 第 @ 步 所 求解 的 回归 方程 当中 ， 判定 系 数 的 值 较 大 的 那个 就 是 我 们 所 要 求 的 回 
归 方 程 。 
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第 26 页 中 出 现 的 美 羽 的 “年 龄 ”和 “身高 ”的 回归 方程 ，?》= 一 -全 +173.3 
是 如 何 求 出 来 的 呢 ? 下 面 给 出 计算 过 程 。 


国美 羽 “ 年 龄 ”和 “身高 ”的 回归 方程 的 求解 方法 


y= +b , 令 士 =X 
y=$+b=aX+b 
这 样 就 可 以 将 其 改写 成 “直线 ”的 形式 。 


正如 第 70 页 说 明 的 那样 ， 回 归 方 程 y=aX+b 中 ，a 和 4b 的 值 可 以 通过 以 下 计算 
求 得 。 





= Oe 715.9563 __ * 
「 3. TAS 326.6 


b=} - Xa = 138.2625 — 0.1072 x (~ 326.6) = 173.3 


326.6 


因此 ， 回 归 方 程 为 : ッ =ー326.6x+ 173.3 Fe y=-—— + 173.3 
{ T tof 
— 身高 年龄 
年 龄 


党 这 里 所 写 的 计算 值 不 应 是 -326.6， 而 应 是 所 求 得 的 -326.3。 这 是 由 于 四 舍 五 人 而 产生 的 误差 。 
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を 表 2.3 a 和 b 的 计算 过 程 
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年 龄 =a 身高 2 3 E 
x lay 2 xX YF EXP | OFY [OXF 
x 
4 ー38.1625 | 0.0204 |1456.3764| 一 5.4515 
5 ー31.0625 | 0.0086 | 964.8789] —2.8841 
6 ー24.1625 | 0.0035 | 583.8264) —1.4381 
7 ー16.5625 | 0.0013 | 274.3164) —0.5914 
8 ー11.4625 | 0.0003 | 131.3889) —0.2046 
9 一 7.3625 | 0.0000 | 54.2064) —0.0292 
10 —0.7625 | 0.0001 0.5814} 0.0055 
11 4.9375 | 0.0003 | 24.3789| 一 0.0802 
12 11.1375 | 0.0006 | 124.0439) —0.2653 
13 13.3375 | 0.0009 | 177.8889) —0.4032 
14 15.7375 | 0.0013 | 247.6689) —0.5622 
15 16.3375 | 0.0016 | 266.9139} —0.6614 
16 16.7375 | 0.0020 | 280.1439) —0.7473 
17 16.8375 | 0.0023 | 283.5014) —0.8137 
18 17.0375 | 0.0027 | 290.2764) —0.8790 
19 17.4375 0.0030 | 304.0664] —0.9507 
5464.457! .9563 





本 章 中 关于 “ 重 回归 分 析 中 的 预测 区 间 ” 的 相关 内 容 已 经 传送 到 网 站 
http:/www.okbook.com.cn， 名 为 “ 重 回归 分 析 中 的 预测 区 间 ” 的 文 
件 夹 中 ， 请 您 下 载 参 考 。 
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今天 我 们 要 讲 “ 重 回归 
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ki F 
ALERE 少 东家 。 


) ( 






























































リク BI, RAAF 
ktere! 





到 目前 为 止 ， 
有 10 个 店铺 。 





我 们 要 用 重 回归 
分 析 ， 预 测 一 下 
这 家 新 店铺 的 营 
业 额 ! 
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重 回归 分 析 就 是 通过 重 回归 分 析 ， 可 以 

多 个 因素 进行 预测 的 理解 成 “有 2 个 以 
上 自 变量 的 回归 分 
析 "。 


所 求 的 回归 方程 也 
相应 地 变 成 “FO 
归 方 程 ”! 


goeze 


G=Qa + Q2zRrt ` オ の p ズ p +b 


MASTER 


重 回归 方程 和 回归 
方程 很 相似 啊 上 





总 而 言 之 | 
这 就 是 回归 分 析 和 重 回归 分 析 的 
Bal, 


回归 分 析 
ous | 




















2. 重 回归 分 析 的 实例 灾 








那么 ， 分 析 的 流程 
也 和 回归 分 析 很 相 


似 吗 ? 


















































































































































重 回归 分 析 的 流程 
@ 首先 ,为 了 讨论 是 否 具有 求解 重 回归 方程 的 意义 ， 夯 出 各 个 自 变量 和 















































因 变量 的 散 点 图 。 















































@ 求 解 重 回归 方程 。 





















































® 确认 重 回归 方程 的 精度 。 

































































@ 进行 “ 重 回归 系数 的 检验 ”。 


























© 总 体 回归 x+4ao+…+4pp+B 的 估计 。 




















© 预测 。 




































































































































































这 就 是 重 回归 
分 析 的 过 程 。 
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① 首先 ， 为 了 讨论 是 否 具有 求解 重 回归 方程 的 意 


因 变 量 的 散 点 图 








那 就 赶快 开始 


TREI 首先 ， 我 们 来 看 一 下 


现 有 店铺 的 数据 。 




















































































































好 的 。 



























































梦 之 丘 总 店 
寺 井 站 大 厦 店 
曽根 店 
桥 本 大 街 店 
桔梗 町 店 
邮政 局 前 店 
水 道 町 站 前 店 
六 条 站 大 厦 店 
若 叶 川 店 
美里 店 

党 坪 ， 日 本 面积 单位 名 ，1 坪 约 为 3305785mz。 





“月 营业 额 ” 是 因 变 量 
其 他 的 是 自 变量 是 这 
样 吧 ? 
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“BMGR fo ASU 
BI KSB =0.8924 














“VERGARA UR 
单 相关 系 格 =0,7751 
































— REYTT] 
* 。 太 条 站 大 导语 ARIK 
— a Ae ee mineras —R 
IRSKE KERE RIB 
月 300| PRERE RD HRANE 
H skag BAIA z BM 
aw Wn om MAKES ‘eee 
100 lo 
0 9 
2 4 6 8 0O 2 D w i w 2 w W 
BAER BRCM 
B R, 
es 
*— 看 起 来 ， 店 铺面 积 越 大 ， 具有 求解 重 回归 
4 距 最 近 的 车 站 越 近 ， 月 方程 的 意义 啊 | | 
营业 额 就 越 高 ! z4 R 
an 
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@ 求解 重 回归 方程 ; 
























































: Tee ts 
求解 重 回归 方程 时 的 / g 
计算 方法 和 求解 回归 = —— 
方程 时 几乎 是 一 样 的 。 
Alo ie ; 
SS A! 





— 
> 


J 
M 





Kk, KF a, hob KMD, FMD 
值 为 0， 再 求 出 令 S 的 值 最 小 时 的 ai, 


Re A 
+(366~(Qi xB +02 7 の ETT 
a Et 
+ BAO Pe bb Landay Pst tet na 


本 来 是 要 按照 刚 
刚 说 的 一 步 步 做 
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e- 
g 
に も コ 
RE 
4* 
3* 
aR 


y 














L a 
= 
cg- 
~~ RA 
cof 
ogo 
~ag- 
>g- 
inĝ- 
wo R- 

æ o 一 
eg- 


et Sn ed 





® 


这 , 这 是 什么 啊 ! 








RA 
た 


K 


BRR AE | 





用 这 样 的 计算 
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为 了 便于 计算 ， 在 求解 
重 回归 方程 的 时 全， 必 








f | | | mea aR ot 1 

a 上 [各个 数值 代表 的 | 

い | 意义 是 这 样 的 。 

NY 
J 

W 
数值 的 意思 ， 我 是 这 要 是 用 手 算 的 我 要 用 笔记 本 电脑 
明白 了 ， 不 过 我 能 话 ， 还 不 得 算 到 来 算 ! 


算出 来 吗 …… RRM | 



























































































































































fo © A — 


iG 








AFUE ME | 自 变量 偏 回归 系数 
店铺 面积 a 415 
距 最 近 车 站 的 距离 |a -03 


常数 项 b 653 哈哈 1 Ae 
ae. 党 求解 方法 见 
第 205 页 


























Gal 52/-03224 653 
ft f 


ASUR AMER BREE | ey 
站 的 距离 4 





风 见 面包 上 店 的 
重 回归 方程 就 
是 这 样 的 。 





虽然 和 求解 重 回归 方程 
没有 直接 关系 但 是 因为 
它 很 重要 ， 所 以 要 事先 
说 明 一 下 。 





112 83% 重 回归 分 析 














BEDE FE yraxitax:t+-tanyth P, 
Kiba, a o, DREAM, ALAA 
i, yo, BF) MK, HR HPS 





也 就 是 说 ， 这 个 y=41.5x1 一 0.3x2+65.3 24 “AMG R HP, “HRI FIER" 的 
平均 值 、“ 月 营业 额 ” 的 平均 值 相 对 应 的 1 








@ 确认 重 回 归 方程 的 精度 








MAHAR, ATA 
m TERA NI 和 回归 分 析 一 样 也 存 
— — 在 ' 重 相关 系数 "和 " 判 
精度 了 吧 ? W\ eae 22 
NG A 
2 
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将 其 平方 之 后 就 得 到 判定 系数 だ 。 


实测 值 和 预测 值 了 的 音 相 关系 数 就 是 重 相关 系数 R， 合 







-DG (9-3). 


469 453.2 137.2] 121.4] 18823.8 | 14735.1 16654.4 250.0 








SZ 





































































































寺 间 站 大 厦 店 | 366 397.4 342| 656| 11696| 43075| 22446 | 988.0 
曽根 店 | 371 3293 392| -25| 15366 65 -998 | 1742.6 
桥 本 大 街 店 | 208 2047 -123.8|-127.1 | 15326.4 | 161507 | 15733.2 10.8 
桔梗 町 店 | 246 253.7 -858| -781| 7361.6] 61069| 67050 | 58.6 
邮政 局 前 店 | 297 319.0 -348| -128| 1211.0] 163.1 4444 | 485.3 
水 道 町 站 前 店 | 363 342.3 31.2) 10.5] 973.4] 1099 327.1 | 429.2 
六 条 站 大 厦 店 | 436 438.9 1042| 107.1 | 10857.6 | 11480.1 | 111645 87 
著 叶 川 店 | 198 201.9 -133.8|-1299 | 17902.4 | 16870.5 | 17378.8 153 
美里 店 | 364 377.6 322| 45.8] 10368| 20964] 14743 | 1846 
总 it |3318 3318 0 | 0 | 7619.6] 720266 | 720266 | 4173.0 
平 均 331.8 331.8 1 1 1 | 
l ! S s Sy s, 
j 5 t 
Se 在 计算 重 相关 系数 及 
时 ， 虽 然 不 会 涉及 ， 但 
是 对 之 后 的 运算 很 重要 ， 
所 以 要 先 求 出 来 。 
重 相关 系数 R 是 
* VARA — 
PEN a V5 S 
= 66 _ 09722 
V76199.6 x 72026. 
判定 系数 到 是 `~ ) N 
R° = (0.9722) = 0.9452 azar ||! 
0.9452] SX 
7 6 
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判定 系数 R 的 取 值 
范围 ， 还 是 从 0 到 


没 错 。 重 回归 方程 的 精 
度 越 高 就 越 接近 1， 否 
NA, MARL 0。 

















还 是 和 回归 方程 一 样 那 这 个 重 回归 方程 的 at | 
没有 衡量 标准 吗 ? 精度 已 经 很 高 了 啊 上 都 几乎 是 1 了。 
ジン KS 
J ンク ググ x Kez) 
“9 の k SN 
s% 3 
— \ eg 











是 的 ， 不 过 还 是 以 “0.5 
以 上 ”作为 标准 吧 ! 





















































MALT, ERAGE, E 
aiSiy + a2S2y + + apSpy 
人 ーー ピタ | 


这 样 的 关系 还 是 成 立 的 。 


3 的 思考 方法 请 参见 第 138 页 


ERF Sy. Sy os 





实际 上 判定 系数 
是 存在 缺点 的 。 


判定 系数 的 值 就 
REMARK |! 


ite, SLB BAER IEP mA E 
KM -ARAA 不 加 的 时 候 ， 判 定 系数 
的 值 是 0.9452, 


梦 之 丘 总 店 
寺 井 站 大 厦 店 
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BAA 


aR 











に タン 


Drs · 


MRL =0.0368 


vas aran 
aks Kaasua 
ornans 
sas 
WAAR Bot | 
wa 





“ 店 长 年 龄 "和 “月 营业 额 ”、 


是 完全 没有 关系 的 1 


R=0945 


Kët, AZAK 
的 值 还 是 变 大 了 

















修正 自由 度 的 判定 系数 的 值 可 以 通过 以 下 计算 
求解 出 来 ! 

那么 ， 美 羽 你 来 求 一 下 ， 不 

S 加 “ 店 长 年 龄 "和 加 了 以 后 

HERE ARENE AAKAT, BE AWRH 


R=1- 判定 系数 的 值 吧 ! 

































































O 只 有 “店铺 面 可 ” 和 “ 距 最 近 丰 站 的 距离 ”的 情况 


HA, 是 只 有 “店铺 面积 ” 
和 “ 距 最 近 车 站 的 距离 ” + RRR ZO, 9452 


+ GBESPRAAZZER'’?R 


saad 


= 


173-0 ) el | 


_\ 0-2-1 
( 76199. 6 ) 
10-1 


= 0.92% 
Ws 


=! 
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9296 了 。 
Wy NY 


那么 ， 只 需要 求 出 修正 
自由 度 的 判定 系数 的 值 


S. 的 计算 有 些 复杂 ， 
所 以 我 已 经 用 电脑 求 


那么 ， 接 下 来 是 RAR 
BREE BER” TERR TRS 
WA BRE ER — 





在 长 的 
Eal 年 龄 对 了 ， 
是 0.9495 | 


























哎呀 ， 这 种 情况 下 的 Sy 和 
Se 是 什么 样 的 呢 ? 


Sm 同 只 考虑 “店铺 面积 ” 
和 “ 距 最 近 车 站 的 距离 " 
时 一 样 。 


OQ “店铺 面积 "、" 距 景 拓 丰 站 的 距离 ”以 及 “ 丫 长 年 龄 ” 
都 考虑 的 情况 。 


+ ARERR R O0, 9495 
・ BEGHRAARZZER'’?R 


gfs 


( Pr 
— 
76199.6 — 
10-1 
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XY NAN EE da is ee 
te leet. “Z 


“BaGR 
“ 距 最 折 东 站 的 Re eae 
距离 ” “BK 
R | 0.9452 人 0.9495 二 
Kit | 
09296 > 0.9243) : 


仔细 看 看 ， 在 (和 加 中 ， 同 判定 系数 
R 相 比 ， 修 正 自由 度 的 判定 系数 及 + 
的 值 都 变 小 了 咱 | 









ee! 
修正 自由 度 的 判定 系数 
RR*? 的 值 在 不 加 “ 店 长 

年 龄 ”的 情况 中 下 会 比 
























所 以 在 确认 重 回归 方程 的 精 
度 时 ， 我 们 只 要 通过 R*? 的 
值 ， 进 行 判断 就 可 以 了 | 
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重 回归 分 析 也 是 
需要 推测 总 体 情 


是 “回归 系数 的 检验 ”和 
总 体 回归 的 估计 吗 ? 





































你 还 记得 做 完 回 
归 分 析 之 后 所 讲 
的 那个 前 提 吗 ? 


ka | 
重 回归 分 析 也 是 
test | 








“BMGRA x, F, 
RAG KERA xm 
RFLG ' RK 


平均 值 为 人 ixa+Asxa+B， 标 准 卷 为 o 的 





只 有 确信 这 个 假设 一 
定 成 立 之 后 ， 才 能 进 
行 分 析 ! 





图 进行 “回归 系数 的 检验 ” 











证 明 过 程 就 不 讲 了 ， 不 过 ， 所 求 出 的 重 回归 方程 
BHA, AL, B, a = 
————— か ん ズ + の な 4 ら 








— 
— 


/ TOD. 
4 i 
— a ed 0 65.3 
J 


JETEN 
0-2-1 
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一 | 所 以 ，“ 重 回归 系数 的 就 和 回归 分 析 有 差别 了 ， 
检验 "， 包括 两 种 类 型 : 












































一 种 是 “全 面 讨论 偏 回归 系数 的 另 一 种 是 “分 别 讨论 偏 回归 
检验 "， 系数 的 检验 "。 


A=A=0 





A= A= 0 不 成 立 。 

即 ， 下 面 任 意 一 组 关系 成 立 : 
A FORA #0 

A #08 A=0 


A, =08 A, #0 


这 样 的 话 ， 以 0.05 
为 有 意义 的 标准 ， 
分 别 做 做 两 种 检验 
æ! 
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将 “店铺 面积 x 坪 、 距 最 近 车 站 的 距离 pm 的 店铺 ” 
作为 总 体 。 








原 假设 为 “41=42=0 成立 "。 
备 择 假设 为 “41=42=0 不成立 "。 
进行 “全 面 讨论 偏 回归 系数 的 检验 ”。 
以 0.05 为 有 意义 的 标准 。 





通过 样本 数据 求 出 检验 统计 量 
的 值 。 


再 将 步骤 5 中 求 出 的 检验 统计 
量 的 值 所 对 应 的 P 值 ， 与 有 意 
义 的 标准 进行 比较 ,看 看 P 值 
是 否 比 其 小 。 


下 面 进行 “全 面 讨论 偏 回归 系数 的 检验 ”“ 全 面 讨论 偏 回归 
系数 的 检验 ”的 检验 统计 量 为 


— 
自 变量 的 个 数 样本 个 数 -~ 自 变量 的 个 数 -1 


所 以 在 本 例题 中 的 检验 统计 量 的 值 为 


761996-41730 , aa wink 
在 本 例题 中 ， 如 果 原 假设 成 立 ， 那 么 检验 统计 量 就 服从 第 
1 自由 度 为 2 (= 自 变 量 的 个 数 )、 第 2 自由 度 为 7 (= 样本 
个 数 一 自 变量 个 数 一 2 ) 的 严 分 布 。 

有 意义 的 标准 是 005。 检 验 统计 量 的 值 为 60.4， 所 以 P 值 
为 0.00004。 


0.00004<0.05， 所 以 P 值 小 。 





如 果 在 步 又 6 中 己 值 比 有 意义 
的 标准 小 ， 则 我 们 就 可 以 得 出 
“ 备 择 假设 成 立 ” 的 结论 。 反 | 
之 ,我 们 就 可 以 得 出 “ 原 假设 
并 没有 错 ” 的 结论 。 
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与 有 意义 的 标准 相 比 , P 值 小 。 所 以 , 备 择 假设 “ 不成立", 
假设 “41=42=0” 成 立 。 








接 下 来 ， 进 行 “ 分 别 讨论 偏 回归 系数 的 检验 ”! 
我 们 以 A 为 检验 对 象 ， 来 示范 一 下 ! 





定义 总 体 。 将 “店铺 面积 x 坪 、 距 最 近 车 站 的 距离 xy 的 店铺 ”作为 
总 体 。 
建立 原 假设 和 备 择 假设 。 原 假设 为 ”41 = 0 成立 "。 
备 择 假 设 为 “41 #0 成立"。 
| 选择 所 要 进行 的 “检验 ” 类 型 | 进行 “分 别 讨论 偏 回归 系数 的 检验 ”。 
A) 设 定 有 意义 的 标准 。 以 0.05 为 有 意义 的 标准 。 
通过 样本 数据 求 出 检验 统计 量 | 下 面 进行 “分 别 讨论 偏 回归 系数 的 检验 ”的 过 程 。 
的 值 。 “分 别 讨论 偏 回归 系数 的 检验 ”的 检验 统计 量 为 




















a & 

Fr”” 样本 个 数 - 自 变量 的 个 数 -1 

所 以 在 本 例题 中 的 检验 统计 量 的 值 为 

4S 4173.0 suo. 

0.0657 * 10-2-1 

在 本 例题 中 ， 如 果 原 假设 成 立 ， 那 么 检验 统计 量 就 服从 第 1 

自由 度 为 1、 第 2 自由 度 为 7 ( = 样本 个 数 一 自 变量 个 数 一 2 ) 

的 分 布 。 
再 将 步 又 5 中 求 出 的 检验 统计 | 有 意义 的 标准 是 005。 检 验 统计 量 的 值 为 44.0， 所 以 P 值 
量 的 值 所 对 应 的 尸 值 ， 与 有 意 | 为 0.0003。0.0003<0.05， 所 以 P 值 小 。 
义 的 标准 进行 比较 , 看 看 P 值 
是 否 比 其 小 。 
如 果 在 步 又 6 中 忆 值 比 有 意义 | 与 有 意义 的 标准 相 比 ,P 值 小 。 所 以 , 备 择 假设 "41 メ 0" 成立 。 
的 标准 小 ， 则 我 们 就 可 以 得 出 
“ 备 择 假设 成 立 ” 的 结论 。 反 
之 ,我们 就 可 以 得 出 “ 原 假设 

加 成立” 结论。 
DE S 的 求解 方法 见 下 页 说 明 。 











但 是 ， 不 管 步骤 7 的 结论 是 什么 ， 我 们 还 是 习惯 性 地 认为 
“只 有 在 检验 统计 量 


ai. S 
S1 “样本 个 数 - 自 变 量 个 数 -1 
这 个 偏 回归 系数 所 对 应 自 变 量 才 对 因 变 量 的 预测 有 意义 。” 


的 值 大 于 2 的 情况 下 ， 
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这 是 步 对 5 中 出 现 的 "Si。 











mie wae っ oe os) 





— 











有 些 参考 资料 中 ， 并 不 是 依据 F 分 布 ， 而 是 依 
据 ! 分 布 来 讲解 “ 偏 回归 系数 的 检验 "的 。 

这 个 问题 从 数学 的 角度 解释 起 来 比较 困难 ， 所 
以 我 们 不 做 详细 介绍 。 LE, Tid BAS Ah 
其 最 终 的 结论 都 是 相同 的 。 
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回 总 体 回归 Aim + Ax + = + Ax + B Atit 





接 下 来 应 该 是 …， | / 


总 体 回归 的 估计 了 AE 


吧 ? | ¢ 

















虽然 和 回归 分 析 大 致 相 


同 ， 但 是 计算 过 程 中 会 
出現 SSR” 
那 可 是 个 大 麻烦 啊 ! 





一 也 是 同 回归 分 析 一 样 ， 
E 都 要 解 出 “置信 区 间 ” 
吧 ? 









































重 回归 分 析 中 的 计算 ， 
才 是 真 的 让 人 抓 狂 呢 ! 


如 果 可 以 的 话 ，“ 
我 们 在 这 合 住 
一 起 努力 吧 ? 
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于 现在 ， 我 们 就 用 数据 HEB | 


分 析 软 件 来 求 置信 区 间 H 
we! ヽ 

Y RAM! 
虽然 很 可 靠 ， 不 过 ( = 只 有 在 关键 的 
我 们 也 不 能 偷懒 。 时 刻 才 可 以 使 


£ NOLS 
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总 体 回归 A,X 10442 X804+B AE 
信 度 是 95% 的 情况 下 ， 应 该 处 于 
418.3 万 日 元 以 上 488.1 万 日 元 以 











焉 离 最 近 车 站 的 距离 
这 个 就 是 现在 要 开 的 (m) 
店铺 的 数据 。 
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太 好 了 | 
MEA RM)! 
\ 


Y= 4l.5x1 -03X + 65.3 
g| = 41.5x10- 0.3110 465.3 




















rN 
( 
MA 


做 回归 分 析 的 时 候 ， 置 信 区 间 和 预测 区 


有 ， 这 么 说 ， 重 回归 分 析 mau : 
— 间 的 求解 方法 是 很 相似 的 。 那 重 回归 分 
也 要 像 回归 分 析 屠 样 求解 — 


出 “预测 区 间 "， 是 吗 ? 
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TA, MA “Bo 
马 …” 是 什么 呢 ? 


J| =, rers 《BA 
软件 计算 的 吧 ! 
— 
———— = AM |! 
By N an: 





















375.1 以上, パ 
510.9 以 下 。 


太 谢谢 你 们 两 个 了 ， 
为 我 提供 了 参考 ! 














最 后 作为 赠品 ， 再 介 
绍 一 种 更 好 的 求解 重 
回归 方程 的 方法 。 






























































像 刚刚 “ 店 长 年 龄 "这样 的 
和 因 变 量 不 相关 的 自 变量 
也 是 存在 的 。 


重 回归 分 析 也 和 回归 分 析 
一 样 ， 无 论 什么 数据 ， 者 
是 通过 数学 的 方法 求解 基 
本 重 回归 方程 的 。 
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认真 听 我 把 话 
说 完 ! 


但 是 ， 自 变量 越 多 
计算 过 程 不 就 会 越 
麻烦 吗 ? 
















cy Geax ERT RISEN A 
3g? Y= AiXithaka+b —— 


mae 
SSA 247 =QAZithXz+b Fara 人 
Bp > Re S 





考虑 到 以 上 情况 ， 对 于 
分 析 者 来 说 ，“ 更 好 的 
重 回归 方程 ”可 以 说 是 
“ 自 变量 个 数 不 多 、 并 
且 精 度 又 高 的 重 回归 
方程"。 
















这 种 “ 自 变量 个 数 不 多 、 并 且 精 度 高 的 


得 回归 方程 ”的 未 解 方法 是， っ 


易 必 的 方法 一 一 “最 优 


”变量 增加 法 
”变量 减少 法 
”变量 增 减法 
”基地 “情报 量 标准 ”的 


a 


“Xi 和 Xz + XXIX 
・ ズ , 和 ズ 3 
・ ズ > 入 ズ ョ 








那 就 用 “最 优 子 
全 法 ”具体 分 析 
ー〒 1 














修正 自由 度 的 

HERUR”? 
0.7709 
0.5508 








由 “店铺 面积 "和 
A SRL AA 
组 合 后 的 重 回归 方程 
精度 最 高， 
就 应 该 是 这 个 ! 


个 自 变量 的 呢 ， 


那 应 该 是 MR 
roe 


这 3 
还 是 
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能 理解 醒 回归 
3? 


是 有 | 
分 析 了 真是 谢谢 您 啦 ! 

























































































那么 ， 未 来 的 店 长 先生 ， 
作为 数据 分 析 的 次 用 









X — A 
您 是 不 是 应 该 请 我 们 a < の 
吃 牛 角 面包 啊 ! r ZN Pha ty 
—— 
fe E : 
sz (oD 
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帘 3. 重 回 归 分 析 过 程 中 的 注意 事项 * 





下 图 中 ， 我 们 再 次 给 出 106 页 中 出 现 的 重 回归 分 析 的 过 程 。 


① 首先 ， 为 了 讨论 是 否 具有 求解 回归 方程 的 意义 ， 画 出 各 自 变 量 和 因 变 量 的 
散 点 图 。 

! 

四 求解 重 回归 方程 。 

i 

@ 确认 重 回归 方程 的 精度 。 

! 

图 进行 “ 偏 回归 系数 的 检验 "。 

! 
回 总 体 回归 4ixi+4daxs+…+4dpp+B 的 估计 。 
© 预测 。 








B31 重 回归 分 析 的 过 程 
此 前 ， 在 我 们 的 讲解 中 ， 必 须 完成 上 图 中 的 第 〇 D 步 到 第 @) 步 。 但 事实 并 非 如 此 。 
同 回归 分 析 一 样 ， 不 同 的 情况 下 ， 只 完成 第 @ 步 到 第 @ 步 亦 可 。 

但 是 在 本 章 中 提 到 的 风 见 面包 店 只 有 10 个 店铺 而 已 ， 而 且 举 例 中 所 用 的 店铺 面 
积 为 10 坪 \ 距 最 近 车 站 距离 为 80m 的 店铺 ,也 只 有 “ 梦 之 丘 总 店 ” 这 一 家 。 这 样 一 来 ， 
在 估计 总 体 回归 A, x 10+4。x 80+B， 或 是 在 进行 “ 偏 回归 系数 检验 ”时 ， 就 可 能 会 
使 读者 产生 疑问 了 。 这 也 是 情 有 可 原 的 。 实 际 上 ， 理 纱 是 在 如 下 解释 的 基础 上 进行 
分 析 的 。 








“店铺 面积 为 10 坪 、 距 最 近 车 站 距离 为 80m” 一 一 像 这 样 的 店铺 ， 风 见面 包 店 
今后 还 会 开设 很 多 。 这 次 只 不 过 是 从 这 样 的 店铺 群 中 ,随机 抽取 到 " 梦 之 丘 总 店 " 而 已 。 














对 于 理 纱 的 解释 可 以 说 还 是 有 值得 商检 的 地 方 。 笔 者 认为 这 是 一 个 比较 牵强 的 
解释 。 严 格 地 说 ,如 果 我 们 考虑 到 风 见 面包 店 的 人 气 问题 ,那么 就 可 以 说 它 是 一 个 “ 非 
常 没有 根据 的 解释 ”。 既然 如 此 ,是 否 还 需要 专门 进行 总 体 回归 的 估计 或 是 “检验 " 呢 ? 
笔者 认为 ， 还 是 要 从 记述 统计 学 的 角度 进行 分 析 ， 判 断 是 否 需 要 。 
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RA 标准 化 残 差 灾 








同 回归 分 析 一 样 ， 这 里 也 有 必要 对 重 回归 分 析 的 标准 化 残 差 进行 讨论 。 重 回归 
分 析 的 标准 化 残 差 为 

















BH = アポ 
| 残 差 平方 和 | る 
样本 个 数 - 自 变量 个 数 -1 样本 个 数 - 自 变量 个 数 -1 
下 表 中 记录 的 是 本 章 例子 中 的 标准 化 残 差 。 
$ 表 3.1 ”本章 例 子 中 的 标准 化 残 差 
标准 化 残 差 
店铺 的 | 距 最 近 
y- 
面积 | 车 站 的 距离 月 营业 额 月 营业 额 残 差 = 
x n y =4150-03xm+653| y- 10-2-1 
梦 之 丘 总 店 | 10 80 46 
寺 井 站 大 厦 店 | 8 0 366 
曽根 店 | 8 200 371 
桥 本 大 街 店 | 5 200 208 2047 33 01 
桔梗 四 店 | 7 300 246 253.7 -77 -03 
邮政 局 前 店 | 8 230 297 319.0 -220 -09 
水道 町 敵前 店 | 7 40 363 3423 20.7 08 
六 条 站 大 厦 店 | 9 0 436 438.9 -29 -01 
若 叶 川 店 6 330 198 201.9 39 0.2 
美里 店 | 9 180 364 377.6 -13.6 -0.6 

















标准 化 残 差 的 绝对 值 大 的 个 体 ， 被 看 成 与 其 他 的 个 体 性 质 不 同 。 当 绝对 值 大 于 
3 的 个 体 存在 时 ， 将 其 剔除 之 后 ， 再 进行 重 回归 分 析 。 
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帘 5. 马 氏 距离 以 及 重 回 归 分 析 中 的 置信 区 间 和 预测 区 间 窜 





如 127 页 和 131 页 所 述 ， 在 计算 重 回归 分 析 的 置信 区 间 和 预测 区 间 的 过 程 中 ， 
出 现 了 所 谓 的 马 氏 距离 (Mahalanobis Distance )。 这 与 我 们 在 初中 和 高 中 学 过 的 普通 
距离 一 一 欧 氏 距离 ( Euclidean Distance) 有 所 不 同 ， 是 一 种 重新 定义 的 距离 概念 。 

读者 可 能 会 问 “ 为 什么 要 专门 定义 出 这 样 一 种 距离 呢 ? ”对 于 这 个 问题 ,笔者 
本 想 进 行 回答 ， 但 是 由 于 篇 幅 所 限 ， 并 且 与 本 书 的 写作 主旨 没有 太 大 关系 ， 所 以 只 
好 点 到 即 止 。 但 是 ， 稍 后 会 讲解 其 计算 方法 。 可 是 不 管 怎样 ， 马 氏 距 离 在 统计 学 中 
是 赫赫 有 名 的 ， 所 以 无 论 何 时 都 请 记 住 它 。 顺 便 提 一 下 ， 马 氏 “Mahalanobis” 是 数 
学 家 Prasanta Chandra Mahalanobis 的 名 字 。 

接 下 来 ,我们 讨论 本 节 的 主题 。 重 回归 分 析 的 置信 区 间 的 求解 顺序 如 下 所 述 。 
为 了 方便 起 见 ， 我 们 仍然 使 用 第 129 页 提 到 的 “ 梦 之 丘 总 店 ”的 例子 ， 讲 解 其 置信 
区 间 的 求解 过 程 。 





S. Sa sgt ge 
Gig oe By Se Sy Sy) (SH sto 





例如 ， 其 中 的 “S。 ”表示 “第 2 个 自 变量 的 离 差 平方 和 "，” Sos” RER “第 
2 个 自 变量 和 第 5 个 自 变量 的 离 差 积 和 ”， 不 难 理解 它 与 “5;, ”是 相等 的 。 
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这 里 所 求 得 的 $' 和 S 的 值 同 第 126 页 出 现 的 值 是 相同 的 。 同 时 不 仅 限于 此 例 ， 


Su Sa Sy 
Sa Sn 


T S| 中 Seasv 的 值 
Sa ww SS, 


* “分 别 讨论 偏 回 归 系 数 的 检验 ”中 所 求 得 的 5“ 和 5 的 值 
都 一 定 是 相同 的 。 


求 “ 马 氏 距 离 的 平方 "。 
D = [一 天 0 一 天 3 + (x -FC FDS? tt RD HS” 
Ha- DS + (HY — HIS? t+ (a = EY, -3S 














"キー EDS H (x, = EC, 5"]( 欄 本 人 数 -1) 
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a,x 10+, x80+5 
= 415 x10-0.3 x80 +65.3 





=453 









在 求解 预测 区 间 的 时 候 ， 同 回归 分 析 一 样 ， 区 间 宽 度 不 是 


而 是 


当 置 信 度 是 99% 的 时 候 ， 只 需 将 
F (1, 样本 个 数 - 自 变量 个 数 - 1;0.05)= F (1,10 - 2 - 1;0.05) 5.6 这 一 部 分 ， 
替换 为 

下 (1 样本 个 数 - 自 变量 个 数 1;0.01) =F (1,10 - 2- 1,0.01)= 12.2 就 可 以 了 。 
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& 6. 自 变量 为 分 类 数据 时 的 重 回 归 分 析 & 








下 面 ， 我 们 再 次 给 出 第 107 页 出 现 的 表格 。 
る 表 3.2 第 107 页 出 现 的 表 


店铺 面积 距 最 近 车 站 距离 月 营业 额 
( 坪 ) (m) (万 日 元 ) 
梦 之 丘 总 店 10 80 469 
寺 井 站 大 厦 店 0 366 
曽根 店 200 371 
桥 本 大 街 店 200 208 
桔梗 叮 店 300 246 
邮政 局 前 店 297 
水 道 叮 站 前 店 40 363 
六 条 站 大 厦 店 0 436 
若 叶 川 店 330 198 
美里 店 180 364 





oe uo I oe ge 
8 
き 











由 上 表 可 知 ， 作 为 自 变量 的 “店铺 面积 ”和 “ 距 最 近 车 站 的 距离 ”以 及 作为 因 


变量 的 “月 营业 额 ”都 是 数值 数据 。 

在 重 回归 分 析 中 ， 因 变量 必须 为 可 测 变量 ， 而 自 变量 则 可 以 是 

— 仅 为 数值 数据 

,数值 数据 和 分 类 数据 的 混合 

* 仅 为 分 类 数据 

这 三 种 之 一 。 

下 面 我 们 举 两 个 数值 数据 和 分 类 数据 混合 时 的 例子 ， 和 一 个 仅 为 分 类 数据 的 例 
子 。 
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图 数值 数据 和 分 类 数据 混合 时 的 例子 <1> 
















有 品尝 专柜 | 无 品尝 专柜 





PLEŠ 
寺 井 站 大 厦 店 
曽根 店 
BAKE 
桔梗 叮 店 
邮政 局 前 店 
水 道 叮 站 前 店 
六 条 站 大 厦 店 
车 叶 川 店 
美里 店 


| 











那么 ,通过 对 以 上 数据 的 分 析 ， 我 们 可 以 求 出 其 重 回归 方程 为 : 
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图 数值 数据 和 分 类 数据 混合 时 的 例子 <2> 


















店铺 面积 
Eh 距离 m) 在 周 六 开放 = iH) 
梦 之 丘 总 店 | 10 80 0 0 469 
寺 井 站 大 厦 店 8 0 0 1 366 
曾 根 店 8 200 0 0 371 
桥 本 大 街 店 5 200 0 1 208 
桔梗 叮 店 300 0 1 246 
邮政 局 前 店 8 230 0 1 297 
水 道 叮 站 前 店 7 40 0 1 363 
六 条 站 大 厦 店 9 1 0 436 
车 叶 川 店 6 0 1 
美里 店 9 1 0 














那么 ， 通 过 对 以 上 数据 的 分 析 ， 我 们 可 以 求 出 其 重 回归 方程 为 : 
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图 仅 为 分 类 数据 的 例子 



















梦 之 丘 总 店 
寺 井 站 大 厦 店 
曾 根 店 
桥 本 大 街 店 
桔梗 叮 店 
邮政 局 前 店 
水 道 町 站 前 店 
六 条 站 大 厦 店 
车 叶 川 店 
美里 店 





和 
coooo0ooo-o- 
ー ゥ っ ら ー-ー っ らら っ っ oo っ 











那么 ， 通 过 对 以 上 数据 的 分 析 ， 我 们 可 以 求 出 其 重 回归 方程 为 







特别 地 ， 我 们 将 这 种 自 变量 仅 为 分 类 数据 的 重 回归 分 析 称 为 数量 化 I 类 。 
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&7. ZEHRİ R 





本 节 的 内 容 有 些 难 ， 所 以 只 做 简单 介绍 ， 点 到 即 止 。 

如 果 自 变量 之 间 存 在 很 强 的 相关 性 ， 就 会 出 现 如 下 奇怪 的 情况 : 

+ 求 不 出 偏 回归 系数 

+ 即便 可 以 求 出 偏 回归 系数 ， 也 会 出 现 本 应 是 正 值 的 地 方 ， 不 知道 为 什么 会 求 出 
负 值 。 





在 数学 上 ， 当 出 现 
Sn Sa Sy 


Sy Se Se EAR "的 值 为 0。 





ae Sy 
JEPIT T| evenness. 0. 
Sp Sp Sp 


这 样 的 情况 时 ， 我 们 就 将 其 称 为 “存在 多 重 共 线性 问题 "。 


我 们 可 以 通过 VIF? RAE? (Tolerance ) 这 样 的 指标 ， 来 判断 是 否 “ 存 在 多 重 
共 线 性 问题 "。 在 Excel 中 ， 求 行列 式 的 值 所 使 用 的 “MDETERM” 函 数 ， 也 是 一 种 
求 行列 式 的 值 的 方法 。 
无 论 在 学 习 重 回归 分 析 时 这 个 问题 有 多 么 深奥 ， 读 者 只 需 掌握 到 以 下 程度 即 可 ， 
也 就 是 “ 当 自 变量 之 间 存 在 很 强 的 相关 性 时 ， 我 们 可 以 省 去 其 中 任意 一 个 自 变量 后 再 
进行 分 析 ”。 
1 本 书 不 做 说 明 。 


2. 本 书 不 做 说 明 。 
3. 本 书 不 做 说 明 。 
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あ 8.“ 各 自 变量 对 因 变 量 的 影响 ”和 重 回归 分 析 ゐ 





对 于 在 本 书 中 初次 接触 重 回归 分 析 的 读者 ， 可 以 跳 过 以 下 内 容 不 做 阅读 。 
重 回归 分 析 ， 不 仅 可 以 用 作 一 种 预测 手段 ， 而 且 也 可 以 用 作 一 种 调查 “各 自 变 
量 对 因 变量 的 影响 ”的 方法 。 


我 们 来 读 下 面 这 个 故事 。 





鸟 越 先生 是 一 家 糖果 公司 的 产品 开发 研究 员 。 乌 越 先生 最 近 负责 的 糖果 
销量 非常 好 。 为 了 找 出 这 种 糖果 畅销 的 原因 ， 公 司 邀 请 了 一 些 评论 人 员 来 斌 
吃 糖果 。 以 下 便 是 当时 使 用 的 调查 问卷 。 





问题 

您 对 这 种 糖果 有 何 评价 ( 每 一 项 只 能 画 一 个 O ) 
Q1 味道 1 不 喜欢 2 一 般 3 喜欢 
の 分 量 1 不 喜欢 2 一 般 3 喜欢 
の 3 便于 食用 | 1 不 喜欢 2 一 般 3 喜欢 
の 4 包装 设计 1 不 喜欢 2 一 般 3 喜欢 
OS 综合 满意 度 | 1 不 喜欢 2 一 般 3 满意 






































下 面 的 表格 记录 的 是 调查 结果 。 
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回答 者 1 
回答 者 2 
回答 者 3 
回 答 者 4 
回答 者 5 
回答 者 6 
回答 者 7 
回答 者 8 
回答 者 9 
回答 者 10 
回答 者 11 
回答 者 12 
回答 者 13 
回答 者 14 
回答 者 15 
回答 者 16 
回答 者 17 
回答 者 18 
回答 者 19 
回答 者 20 








将 变量 逐一 标准 化 ' 以 后 ， 对 上 表 中 的 数据 进行 分 析 。 于 是 可 以 推导 出 如 下 重 
回归 方程 : 


y=0.41x,+0.32x,+ 0.26x, + 0.11x, 


1 
QS. 综合 满意 度 Q1. 味道 
Q2. 分 量 


— | 


Q4 包装 设计 


观察 偏 回归 系数 * 的 值 的 大 小 ， 可 知 “O1. 味道 ”的 值 最 大 。 所 以 ， 乌 越 先 生得 


出 这 样 的 结论 : 味道 对 综合 满意 度 的 影响 最 大 。 


1 在 调查 “各 自 变量 对 因 变 量 的 影响 ”时 使 用 的 一 种 方法 。 


2 变量 标准 化 以 后 推导 出 的 重 回归 方程 的 偏 回归 系数 ， 被 称 为 标准 偏 回归 系数 。 
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味道 对 综合 满意 度 的 影响 最 大 ， 乌 越 先 生得 出 了 这 样 的 结论 。 我 们 可 以 先 不 去 
管 鸟 越 先生 的 心情 如 何 ， 但 是 他 的 这 种 想法 是 值得 我 们 关注 的 。 
鸟 越 先生 认定 ， 上 表 中 的 各 变量 存在 着 如 下 关系 : 





味 道 分 量 便于 食用 包装 设计 


























综合 满意 度 


这 和 我 们 认定 的 重 回 归 分 析 结 构 ' 是 一 致 的 。 但 这 也 未 必 可 行 ， 也 许 真实 的 情 
况 会 是 : 














味道 |] | 分量 包装 设计 








存在 这 样 的 关系 也 不 是 不 可 能 的 。 

同 重 回归 分 析 相 比 ， 研 究 “各 自 变量 对 因 变量 的 影响 ”更 倾向 于 结构 方程 式 模 
型 :这 种 分 析 方法 。 但 是 结构 方程 式 模型 ， 是 一 种 “各 自 变量 对 因 变 量 的 影响 ”可 以 
“自动 地 ”明确 判定 出 来 的 分 析 方法 ， 而 不 是 一 种 没有 规则 的 分 析 方 法 。 这 种 分 析 方 
法 需要 分 析 者 在 分 析 前 ， 主 观 地 假定 各 变量 之 间 的 关系 ， 之 后 才能 求 出 路 径 系数 o 


1. HBR 105 页 。 
2 通常 将 其 称 为 协 方差 结构 分 析 。 
3. 相当 于 重 回归 分 析 中 的 偏 回归 系数 或 标准 偏 回归 系数 。 
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Logistic 回归 分 析 


































































































































































































































































































ð 宽 1.Logistic 回 归 分 析 窜 RN 
牛角 





j | 者 基 让 我 天 的 
(| wee, 
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对 了 ,可 以 人 他 
— 


ATRA, TAH 
店 前 开始 讲课 的 | 








业 额 ”这 样 的 数值 的 分 
析 方 法 。 


・ OOZ FH xx 大 学 的 
に も 


概率 是 一 种 特殊 的 数值 ， 
它 的 值 一 定 是 在 0 到 1 
・ DAB RE WHE 
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cz Ast, & Logistic 
し っ (Ge 3 
EA \/ 


回归 分 析 和 重 回归 分 
新 是 没有 办 法 预测 介 
于 0 到 1 之 间 的 预测 
值 的 。 


所 以 只 能 用 Logistic 
回归 分 析 。 


要 求解 出 这 样 的 — 
AF! | 
































小 
4 
Ve 


\ 
| A N | 这 个 式 子 有 的 人 称 其 为 
“Logistic 回归 模型 "， 而 
我 习惯 称 它 为 “Logistic 
回归 方程 "。 
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| 
很 有 趣 的 图 形 吧 -10 


* 
无 论 z 的 值 是 多 少 
了 的 值 总 是 位 于 0 和 
1 之 间 ， 对 吧 ? 


接 下 来 ， 为 了 便于 理解 








它 的 主要 思想 是 把 “使 样 
本 出 现 的 可 能 性 最 大 ” 作 
为 决策 的 准则 。 


极 大 似 然 法 Za Sy 
(maximun likelihood method)| N 











l [i 
す = pe Cnet Fe? 


-5 "2 5 10 | 
る 


看 起 来 比 著 混乱 ， 所 以 改写 成 oixxTozxs+…OpxpD| 


假如 我 们 任意 挑选 10 个 
人 ， 问 问 他 们 “ 喜 不 喜欢 


n 诺 伦 的 制服 ?” 


— 


作为 总 体 的 “我 们 大 学 全 体 在 校 
学 生 ” 对 诺 伦 的 制服 的 支持 率 假 
RAP. 


Ge to nn UN DY > 
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像 刚刚 表 中 的 那 种 情况 ， 发 生 
的 概率 应 该 是 这 样 的 。 


喜欢 FER BK 不 喜欢 Be 喜欢 喜欢 Bx 不 喜欢 BR 


Px (CCP)xPx((-pP)xpPxPxpPxpPx((-p)xP 
=pU-p) 


所 谓 的 极 大 似 然 法 ， 从 作为 总 体 的 “我 们 大 学 全 体 在 校 学 生 ” 
这 个 例子 看 ， 就 是 对 诺 伦 的 制服 的 支持 窜 的 值 ， 一 定 会 令 


pa-p? 
或 者 

bogtp' 1-p?} 
的 值 为 最 大 。 








Pure 0025: 


0.0020 
0.0015. 


0 Of 02 03 oy as aborto? of I 
— 











* 
Op tig ñt“ 

logit- 0 a1 02 03 oy as 06 09 o? 09 í 
-5 H 




















它 的 基本 想法 ， 可 以 这 样 
解释 。 


从 图像 上 解释 的 话 ， 就 是 求 
这 些 图像 最 高 点 所 对 应 的 横 
轴 坐 标的 一 种 想法 。 
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Ply A “WBS 
leg の のり! A HARER — WIR BAK 


log {p%C-py} 


一 > 对 数 似 然 函数 


Fi AAR BSE RA 


数 似 然 函数 ， 令 它们 的 
值 为 最 大 时 的 p 值 ， 被 
称 为 " 极 大 似 然 估计 值 "。 


Pe ee J| 那么， 就 来 求 一 下 诺 伦 
MARR RRM KIL | 制服 的 例子 中 的 极 大 似 
然 估计 值 的 一 种 方法 ? Riiie l 
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SED ewan. 


px(l-p)xpx(l1-p)xpxpxpxpx(l-p)xp 
=/(1 -př 











SED ewe, FEM 


L=log{p’ (1 -p)} 
= log p' + log(1 - p} 
= Tlog p + 3log(1 - p) 








此 后 ， 将 对 数 似 然 函数 记 为 L。 








CID 对 数 侯 然 丁 笋 关于" 求 微分 , 令 其 什 为 0。 
dL 1 1 1 1 





























ep aa T eR T Tap | 
ED es 中 的 式 子 ， 求 出 极 大 似 然 估计 值 。 
1 1 
7x 一 -3 ぶ ーーー=0 
Pp I-p 
7Tx 工 -3 1 =0 1 
p*r) -0 -0 0 -0 ES 
7(1-p)-3p=0 
7-7p-3p=0 
7-10p=0 tR H 
PERI 
aan miar. で 
Pig al 
I — 
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we) 


N 六 | 


— 


= 
— 


ン | 诺 伦 特 供 ， 就 是 店 里 的 


4 BERR, GRRR 
1%, 7000 日 元 。 








但 是 ， 价 格 低 也 不 能 保 
证 诺 伦 特 供 彼 烂 每 天 者 
能 卖 出 去 ， 是 吧 ? 


Res, 
我 们 就 米 求 一 下 预测 卖 出 


这 对 我 们 店 也 是 


— 很 有 用 的 呢 ! 


Logistic 回归 方程 吧 ! 





这 也 是 我 一 直 以 来 都 在 考 
Bt, ERRERA 


"气温 高 的 日 子 
"AZ, MAAMA 


比较 好 卖 。 











而 周三 是 因为 附近 大 学 的 
社团 成 员 经 常 来 诺 伦 聚 会 
这 样 ， 人 也 显得 比较 多 |! 


会 是 那样 吗 ? 
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ln 


RBAB(C) 


RRERKHUGAZ 





所 以 ， 我 已 经 斌 
着 将 最 近 的 数据 
记录 下 来 了 。 


er, 4 
只 是 这 些 数字 的 话 ， 
还 不 是 很 明白 啊 ! 
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5 8(-) 
68(=) 
78( 三 ) 
88(@) 
9 日 (五 ) 
10 8 (X) 
118(8) 
128(-) 
138(=) 
148 (=) 
15 日 (四 ) 
16 日 (五 ) 
17 9B (六 ) 
18B(B) 
19 8(-) 
208(=) 
218(=) 
22 8(@) 
23 8 (五 ) 


24 日 (六 ) 
25B(B) 





ーー らら ー ら ぐーー ふ くく こく ぐーー ぐ ぐー ぐ る ぐ 





28 
z4 
z6 
24 
z 
28 
允 
26 








~ooo~oo~~So~o~o~oooo 





在 做 Logistic 回归 分 析 时 ， 
T 表示“ 特 供 彼 粒 被 卖 出 的 概率 是 ] ， 
O 表示 “ 特 供 彼 太 被 卖 出 的 概率 是 0"。 


本 来 是 分 类 数据 的 ， 
把 它 看 成 数值 数据 。 


在 Logistic 回归 分 析 中 ， 
自 变 量 可 以 是 


* 仅 为 数值 数据 


* 仅 为 分 类 数据 
“数值 数据 和 分 类 数据 的 混合 


无 论 哪 一 种 ， 都 可 以 进行 分 析 。 





A 
Si 


Lo 





那 是 不 是 也 同 回归 分 
新 或 者 重 回归 分 析 一 


我 觉得 基本 上 
没什么 区 别 。 





















































Logistic 回归 分 析 的 过 程 : 











© 首先 ， 为 了 讨论 是 否 具有 求解 Logistic 回归 方程 的 意义 ， 
画 出 各 个 自 变量 和 因 变 量 的 散 点 图 。 


4 
@ RE Logistic 回归 方程 。 















































4 
确认 Logistic 回归 方程 的 精度 。 
1 











© 进行 “回归 系数 的 检验 ”。 
+ 








© 预测 。 











































































































HLM Logistic 回归 分 析 的 
过 程 。 


















® 首先 ， 为 了 讨论 是 否 具有 求解 Logistic 回归 方程 的 意义 ， 画 出 各 个 
自 变量 和 因 变 量 的 散 点 图 。 











在 Logistic 回归 分 析 
中 ， 最 好 将 因 变 重 作 
为 模 轴 ， 这 样 便于 观 
罕 


特 供 虱 糙 的 销售 情况 周三、 周 六 或 周 日 特 供 蛋 糙 的 销售 情况 最 高 气温 





单 相关 系数 = 0.5095 单 相关 系 格 = 0.4828 


vaga . 川 强 


> 

















i? I 
PREY HAZ PRK HERZ 





或 许 
真 的 存在 
这 样 的 关系 呢 | 


RAGES SS 
合 的 话 ， 就 错开 
RRB. 
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| @ 求解 Logistic 回归 方程 








接 下 来 该 求解 Logisti 
方程 了 吧 | 


OI fins 





MURREAT | 











好 的 





ETF i here. 


周三 、 周 大 或 周 日 特 供 蛋 楼 的 销售 情况 


PS 1 
B des Pac 








— 
+e" 


1 


oro 
l+e 


1 
25H(H) 1p — 














ED sh RNIN 


1 alae * 1 


“a, x0+ 0,284 0) 1+e 





—— 
lte 


卖 出 


CY 3 RAR. 





1 1 1 


1 


1 1 
= los zoraaa |+log | 1 一 moraran |+** + log CORTES TET 
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EY keak. 
极 大 似 然 估计 值 ， 就 是 使 对 数 似 然 函数 的 值 最 大 时 、 a Bb HEL, 
= 244 
a= 0.54 


b =-15.20 





求解 方法 请 参照 第 208 页 。 
对 数 似 然 函 数 世 的 最 大 值 ， 虽 然 和 步骤 4 没有 直接 关系 ， 但 是 考虑 到 其 重要 性 ， 在 
这 里 先 讲 一 下 。 如 下 所 示 : 





1 1 1 
L=log Baixo osx | + log |1- uo | + + log TART TTT TS) 
Ite 1+e 1+e 


=-89 





EES kh Logistic eH. 


对 比 步骤 4 可 知 ，Logistic 回归 方程 为 


1 
y= — ee 
l+e 
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ANN 

ys, 
R, ARLE |+@ +0 SRE) 
Logistic 回归 方程 1 











那么 ， 现 在 就 来 确认 一 下 
所 求 得 的 Logistic 
回归 方程 的 精度 吧 ! 


Logistic 回归 方程 中 ， 
也 存在 “ 重 相关 系数 ”和 
“RAK BP 


AX, Logistic 回归 方程 
只 有 判定 系数 。 
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Logistic 回归 方程 的 判定 系 
数 的 值 是 通过 这 样 的 计算 求 
解 出 来 的 1 


R=|- 対数 似 然 路 数 し 多 最 大 休 
x ‘nilogni+NologNo-(Ri+ No) log (hit ho) 





AF PH m Fo ny 与 回归 方程 和 重 


ual 因 变 量 的 值 为 1 的 个 体 个 数 





m | 四 变 量 的 值 为 0 的 个 体 个 区 








し — 对 数 似 然 函数 上、 的 最 大 值 

计算 一 到! lghtholgro-(htho) log Art Pe) 
-8.9 

Slog +13log (3-(8 + 13) (o9 (848) 








$, 
想不到 会 这 么 低 
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判定 系数 的 取 值 
范围 同样 为 从 0 
到 1, 是 这 样 吗 ? 


Logistic 回归 方程 的 精度 越 高 ， 
值 越 接近 1。 反之 ,就 越 接近 0。 


尽管 如 此 ， | 
Logistic 回归 方程 的 判定 条 数 É 
的 值 基本 上 


都 不 是 很 大 
所 以 ， 参 考 程度 十 分 有 限 。 





我 再 教 你 其 他 的 — Y 
求解 精度 的 方法 。 






























































































































































































































































其 他 的 方法 ? 
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RA 
Š 回 
SHO] 0 28 
6HC)| 0 24 
7H) 1 26 
8 日 四 | 0 24 
98(E)| 0 23 
10 日 の ) 1 28 
IACE) 1 24 
12 日 一 ) 0 26 
13H ご )| 0 25 
14 日 三 ) 1 28 
15 日 四 | 0 21 
16 日 五 | 0 22 
17 日 AN) 1 27 
18 日 (日 ) 1 26 
19 日 一 ) 0 26 
20H(=)| 0 21 
21 日 三) 1 21 
22 日 四 | 0 27 
23H(E)| 0 23 
24 日 (六 ) 1 2 
25 日 日) 1 24 





"m! 

7 日 和 11 日 明明 是 没有 
卖 出 的 ， 但 是 了 却 显示 卖 
出 了 。 


0.80 ( 卖 出 ) 


0.58 ( 卖 出 ) 
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0.51 ( 卖 出 ) 
0.11 ( 没 卖 出 ) 
0.80 ( 卖 出 ) 
0.11 ( 没 卖 出 ) 
0.06 ( 没 卖 出 ) 
0.92 ( 卖 出 ) 
0.58 ( 卖 出 ) 
0.26 ( 没 卖 出 ) 
0.17 ( 没 卖 出 ) 
0.92 ( 卖 出 ) 
0.02 ( 没 卖 出 ) 
0.04 ( 没 卖 出 ) 
0.87 (Set) 
0.80 ( 卖 出 ) 
0.26 ( 没 卖 出 ) 
0.02 ( 没 卖 出 ) 
0.21 ( 没 卖 出 ) 
0.38 ( 没 卖 出 ) 
0.06 ( 没 卖 出 ) 
0.31 ( 没 卖 出 ) 
0.58 ( 卖 出 ) 


SAS ーー ター ムー ウー テー ケー リー バー セー の ドー メー セー ドー は 


12 日 和 21 日 明明 是 卖 出 了 ， 


但 是 了 却 显示 没有 卖 出 。 


如 果 预 测 值 了 大 于 0.5 
的 话 ， 我 们 就 可 以 将 
其 看 作 “ 卖 出 "。 


但 是 ， 你 看 看 这 
个 表 有 没有 发 现 






























用 来 确认 Logistic 回归 方 各 
ARH RAP Ro 


分 析 结果 与 事实 不 一 致 的 个 体 个 煞 
全 部 个 体 个 元 





也 可 以 叫做 = 
这 个 值 越 小 ，Logistic 
ae 回归 方程 的 精度 越 高 ! 


NS 


啊 ， 对 了 ， 还 有 另外 一 个 可 
以 确认 Logistic 回归 方程 精 
度 的 方法 … 


ShyhpHeeAR, & 
后 再 求 出 其 单 相关 系数 
也 是 可 以 的 。 








@ 进行 “回归 系数 的 检验 ” 











AW 


RE, Logistic 回归 分 析 也 A 
要 进行 “回归 系数 的 检验 "。 





“回归 系数 的 检验 "， 但 是 
这 里 有 多 个 自 变量 


原 假设 
SRRA 





“人 | 二 人 2=0” 不 成 立 
即 ， 下 面 任意 一 组 关系 成 立 
+A; FORA #0 


A) FOBA2=0 


那 就 具体 地 算 一 下 吧 ， if | 
有 意义 的 标准 还 是 0.05 | ę > 
i バン 


/ 


NG 
q 


E 


C — A の 


F 








































































x * 7 
首先 ， 进 行 “全 面 讨论 偏 回归 系数 的 检验 ”。 | 
顺便 提 一 下 ， 通 过 下 述 计算 进行 的 检验 ， 通 
常 被 称 为 “ 似 然 比 检验 ” (Likelihood Ratio 
Test )。 

m 将 “周三 、 周 六 或 周 日 为 、 最 高 气温 为 や 
aie 的 日 子 ” 作 为 总 体 。 

— 原 假设 为 “41=42=0 成 立 ” 

o 备 择 假 设 为 “41=4=0 不 成 立 "。 
步 又 下 选择 所 要 进行 的 “检验 ”类 型 。 进行 “全 面 讨论 偏 回归 系数 的 检验 ”。 | 
步骤 4 | 设 定 有 意义 的 标准 。 以 0.05 为 有 意义 的 标准 。 
下 面 进行 “全 面 讨论 偏 回归 系数 的 检验 ”。 
“全 面 讨论 偏 回归 系数 的 检验 ”的 检验 统计 量 为 
2 对 数 似 然 孙 数 的 最 大 值 mlogm-mlogmut (m+ | 
an sp 、 mojlog(m+no)] | 
DRS ARABERA a 在 本 例题 中 的 检验 统计 时 的 值 为 
2[-8.9010-8log8-13log13+(8+13)log(8+13)]=10.1 
在 本 例题 中 ， 如 果 原 假设 成 立 ， 那 么 检验 统计 量 
就 服从 自由 度 为 X = 自 变量 的 个 数 的 x? 分布 
再 将 步骤 S 中 求 出 的 检验 统计 量 的 值 所 | 有 意义 的 标准 是 005。 检 验 统计 量 的 值 为 10.1， 
ARG | 对 应 的 P 值 ， 与 有 意义 的 标准 进行 比较 , | 所 以 P 值 为 0.006。 
看 看 P 值 是 否 比 其 小 。 0.006<0.05。 所 以 P 值 较 小 。 
| 
“| 如 果 在 步骤 6 中 ,P 值 比 有 意义 的 标准 小， 
Fees “ 备 择 假设 成 立 ” 的 结 | 与 有 意义 的 标准 相 比 ，P 值 较 小 。 所 以 ， 备 择 候 
8 论 。 反 之 ,我 们 就 可 以 得 出 “ 原 假设 成 立 " | 设 成 立 。 
的 结论 。 L 
※ X2 分 布 中 己 值 的 求解 方法 请 参见 第 201 页 。 
— | 
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T 

















接 下 来 ， 进 行 “ 分 别 讨论 偏 回归 系数 的 检验 "。 


我 们 以 A 为 检验 对 象 ， 示 范 一 下 ! 


上 顺便 提 一 下 ， 通 过 下 述 计算 进行 的 检验 ， 通 常 被 


RA “Wald 检验 ”。 





将 “周三 、 周 六 或 周 日 为 x1、 最 高 气温 为 x2 て 的 
日 子 ”作为 总 体 。 





原 假设 为 “4 = 0 成 立 "。 
备 择 假设 为 “41 #0 成立 "。 





进行 “分 别 讨论 偏 回 归 系 数 的 检验 ”。 





以 0.05 为 有 意义 的 标准 。 








下 面 进行 “分 别 讨论 偏 回归 系数 的 检验 ”。 

“分 别 讨论 偏 回归 系数 的 检验 ”的 检验 统计 量 为 
2 
a, 
所 以 在 本 例题 中 的 检验 统计 量 的 值 为 

244 _ 
1.5388 


在 本 例题 中 ， 如 果 原 假设 成 立 ， 那 么 检验 统计 量 
就 服从 自由 度 为 1 的 x? 分 布 。 


3.9。 










再 将 步 又 5 中 求 出 的 检验 统计 量 的 值 所 
对 应 的 P 值 , 与 有 意义 的 标准 进行 比较 ， 
看 看 P 值 是 否 比 其 小 。 


有 意义 的 标准 是 0.05。 检 验 统计 量 的 值 为 3.9。 
所 以 P 值 为 0.0489。0.0489<0.05, 所 以 P 值 较 小 。 





n 果 在 步骤 6 中 忆 值 比 有 意义 的 标准 小 ， 
我 们 就 可 以 得 出 “ 备 择 假设 成 立 ”的 
结论 。 反 之 ， 我 们 就 可 以 得 出 “ 原 假设 
成 立 ”的 结论 。 







其 最 终 的 结论 都 是 相同 的 。 





在 有 些 参 考 资料 中 ， 不 是 依据 x 分布， 而 是 依据 
标准 正 态 分 布 来 讲解 “回归 系数 的 检验 ”。 

这 个 问题 从 数学 的 角度 解释 起 来 比较 困难 ， 所 以 
我 们 不 做 详细 介绍 。 但 是 ， 无 论 依据 脏 种 分 布 ， 


与 有 意义 的 标准 相 比 ，P 值 较 小 。 
所 以 ， 备 择 假设 “41 #0” 成立 。 


※ 51 的 求解 方法 见 下 页 说 明 。 

















I 
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0 … (SHA) x(25 日 的 1- ゞ ) 





0 


































在 步骤 5 中 出現 的 S" 是 这 样 求 出 来 的 。 
= ーーーーーーー リ サト 


(SH 的 》) x(GH 的 1-$) 0 se. 0 0 
0 (6 日 的 3)x(6 昌 的 1 了) … 0 0 | 























| 051x049 o … o Yo 2 iſſ“ 
0 0 … 1 
o ox = o |o z% ı 
=|}28 24 … alj . | 
if Se TR 
0 0 — 058x042)Jl1 24 1 
L (1538) … * 
i been 为 了 便于 计算 ， 这 里 必须 全 部 填 上 1。 
这 个 就 是 S"。 这 个 就 是 P. 
上 — I 















































今天 是 星期 日 ， 
最 高 气温 是 BC 
所 以 就 是 这 样 。 





今天 卖 不 出 去 了 | 











Mirm 
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EN a 
NORN 至 此 ， 有 关 “ 回 归 分 析 " 中 的 
> S 。 回 归 分 析 
。 生 回归 分 析 


e Logistic 回归 分 析 
告 一 . 
ge 的 学 习 ， 就 告 一 段落 了 1! 











H a. 
F 
HH 


这 样 ， 无 论 他 什么 时 候 
来 ， 你 们 不 就 能 有 共同 
话题 了 吗 ? 
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DWF 
您 昨天 出 


去 过 吗 ? yA 













































































RY 
Z 











可 以 和 我 
一 起 学 习 吗 ? 


> 









































olojololll 
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%5. “Logistic 回 月 分 析 辻 程 " 中 的 注意 事項 








下 图 再 次 给 出 第 164 页 出 现 的 “Logistic 回归 分 析 过 程 ”。 


O 首先 ， 为 了 讨论 是 否 具有 求解 Logistic 回归 方程 的 意义 ， 画 出 各 个 自 变 量 和 
因 变量 的 散 点 图 。 

の 求解 Logistic 回归 方程 。 

ò 确认 Logistic 回归 方程 的 精度 。 

进行 “回归 系数 的 检验 ”。 

预测 。 








图 4.1 Logistic 回归 分 析 过 程 





此 前 ， 在 我 们 的 讲解 中 ， 必 须 完成 上 图 中 的 第 步 到 第 @ 步 。 但 事实 并 非 如 此 ， 
同 回归 分 析 、 重 回归 分 析 一 样 ， 不 同 的 情况 下 ， 只 完成 第 @ 步 到 第 @ 步 就 可 以 了 。 





& 6. Odds Ratio (优势 比 ) & 








本 节 的 内 容 较为 抽象 。 如 果 是 在 本 书 中 初次 接触 Logistic 回归 分 析 的 读者 ， 可 
以 跳 过 这 一 部 分 ， 不 做 阅读 。 但 是 ， 从 事 与 医 疗 相关 领域 的 读者 ， 还 请 您 稍 作 了 解 。 


6.1 Odds 和 Logit 
1 » 学 y 
= Te 可 以 改写 成 为 T=y 76 Bi log T-y 7? 
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于 是 ， 第 168 页 所 得 到 的 y= sr 机 可 以 改写 为， 
e 


— ニ の mt054 ち 1520. 
tag 


bos > =2.44x, + 0.54x, — 15.20 


Toy Odds. logs? 叫做 Logit。 在 本 章 的 例子 中 ，Odds 就 是 -cwioss Ra ， 


I Logit 就 是 2.44x,+0.54x%, - 15.20 。 
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6.2 优势 比 ( Odds Ratio ) 和 风险 比 ( Risk Ratio ) 









































下 表 再 次 给 出 第 162 页 的 表格 。 
R41 第 162 页 的 表格 
周三 、 周 六 或 周 日 最 高 气温 (C) 特 供 蛋糕 的 销售 情况 
5 日 一 ) 0 28 1 
6 日 二 ) 0 24 0 
7H(=) 1 26 0 
8 日 四 ) 0 24 0 
9 日 五) 0 23 0 
1 日 の ) 1 28 1 
1 日 (日) 1 24 0 
RA) 0 26 1 
1 日 (ご ) 0 25 0 
14 日 三 ) 1 28 1 
15 日 四 ) 0 21 0 
16H (Hi) 0 2 0 
ITH) 1 27 1 
18 日 (日 ) 1 26 1 
19 日 (一 ) 0 26 0 
20 日 二 ) 0 21 0 
21 日 三 ) 1 21 1 
22 日 四 ) 0 27 0 
BHE) 0 23 0 
24H(A) 1 2 0 
25 日 (日 ) 1 24 1 
下 表 是 “周三 、 周 六 或 周 日 ”与 “ 特 供 蛋 糕 的 销售 情况 ”的 联 列表 ( Cross-Tabulation 
Table ) 

る 表 4.2 “周三 、 周 六 或 周 日 ”与 “ 特 供 蛋糕 的 销售 情况 ”的 联 列表 

特 供 蛋糕 的 销售 情况 共计 

卖 出 没 卖 出 

三 、 周 六 是 6 3 9 

或 周 日 不 是 — 10 12 

共计 oe 13 21 
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由 这 个 联 列表 可 知 ,“ 周 三 、 周 六 或 周 日 的 卖 出 率 ”为 ，“ 周 三 、 周 六 或 周 日 
以 外 的 卖 出 率 " 为 号 。 


在 实际 操作 中 ， 往 往 会 用 到 风险 比 的 概念 。 
所 谓 风险 比 ， 以 表 4.2 来 说 ， 就 是 : 


6 
周三 、 周 六 或 周 日 的 卖 出 率 _G) 6,2_6,12 


AZ, MARMEDUARER (2) 9 12 9 2 
12, 





在 实际 操作 中 ， 往 往 还 会 用 到 优势 比 的 概念 。 
所 谓 优势 比 ， 以 表 4.2 来 说 ， 就 是 : 


| (s) 

(ea A 
上 周三 、 周 六 或 周 日 以 外 的 卖 出 率 ay 
wate 


以 上 的 例子 中 ， 表 面 上 看 来 ， 优 势 比 虽然 与 风险 比 有 些 差别 ， 但 实际 上 ， 它 们 
的 值 表示 含义 是 相同 的 ， 所 以 ， 人 们 常常 用 优势 比 来 蔡 代 风 险 比 。 














( 周 六 或 周 日 的 卖 出 率 6 
周三、 周 六 或 周 日 的 卖 出 率 1-(8) ala i 
= = e) FE 
12, 10; 











6.3 未 调整 的 优势 比 和 调整 后 的 优势 比 


下 表 记 录 的 是 采用 最 优 子 集 法 对 表 4.1 中 的 数据 进行 的 分 析 。 
表 4.3 表 4.1 中 数据 的 最 优 子 集 法 分 析 结 












1 
仅 为 “周三 、 周 六 或 周 日 > Tm e216 





Ep] 


仅 为 “最 高 气温 ” っ 7 


este Bat 








ET 


= 92s 40.54, -1520 
1+e 


lelele 





“周三 、 周 六 或 周 日 ”和 “最 高 气温 ” 、 > 
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“e 的 “情况 时 的 回归 系数 ”次 方 ” 为 ewx， 于 是 有 
周三 、 周 六 或 周 日 的 odds EA, =e 230x1-1.61-230x0-161) _ p230 


周三 、 周 六 或 周 日 以 外 的 odds e70 
我 们 将 其 称 为 没有 对 “周三 、 周 六 或 周 日 ”进行 调整 的 优势 比 。 顺 便 说 一 下 ， 
ew=10， 这 个 值 同 前 一 页 求 得 结果 是 一 致 的 。 





“e 的 “情况 @ 时 的 回归 系数 ”次 方 ” 为 2， 于 是 有 


最 高 气温 为 kt+ 的 odds の TU osc us1)—inet-oszxk— 1348) _ 052 
最 高 气温 为 EC 的 odds — 
我 们 将 其 称 为 没有 对 “最 高 气温 ”进行 调整 的 优势 比 。 





“e 的 “情况 @ 时 的 回归 系数 ”次 方 ”为 e%， 于 是 有 


24x1+054xk-1520 
e 244x1+054xkt-1520-Q44x0t054xt-1520 = p244 


e 244 x0+0.54 xk- 15.20 = 


我 们 将 其 称 为 对 “周三 、 周 六 或 周 日 ”进行 调整 的 优势 比 。 


“e 的 “情况 G@ 时 的 回归 系数 ”次 方 ” 为 e“， 于 是 有 


244x140.54x(k+1)-1520  „244x0+0.54x(k+ 1)- 15.20 
e e ニ e034x(+ リー1520-⑩54xk-1520) _ p034 


9 2M x1 4054 xk= 15.20 = っ 244x0+034xk-1520 


我 们 将 其 称 为 对 “最 高 气温 ”进行 调整 的 优势 比 。 


6.4 总 体 优势 比 的 检验 


在 介绍 Logistic 回归 分 析 的 文献 中 ， 有 时 会 提 及 “总 体 优势 比 的 检验 "。“ 总 体 
优势 比 的 检验 ”和 第 176 页 所 讲 过 的 “分 别 讨论 偏 回 归 系 数 的 检验 ”一 样 。 但 是 原 
假设 和 备 择 假设 却 有 所 不 同 。 同 “分 别 讨论 偏 回归 系数 的 检验 ”中 的 


* 原 假设 A=0 
备 择 假设 4 テ 0 


相 比 ,“ 总 体 优势 比 的 检验 ”中 则 是 : 


原 假设 — 
备 择 假设 = どー1 
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6.5 总 体 优势 比 的 估计 


一 般 情 况 下 ， 之 前 所 讲 的 “总 体 优势 比 的 检验 ”的 结果 ， 会 同 总 体 优势 比 的 置 
信 区 间 一 起 介绍 ， 至 少 在 与 医疗 相关 领域 是 这 样 的。 所 以 下 面 来 介绍 一 下 总 体 优势 
比 的 置信 区 间 的 求解 方法 。 

例如 ， 在 本 章 的 例子 中 ， 当 置信 度 为 959%6 时 ,“ 周 三 、 周 六 或 周 日 ”的 总 体 优 
势 比 的 置信 区 间 可 以 通过 以 下 计算 求 得 。 当 置信 度 为 99% 时 ,只 需 将 下 图 中 的 “1.96” 
换 成 “2.58” 即 可 。 


の è“=11.5 ari tat 


= lt fiS senn sf 


=10 = 130.8 
图 4.2 ”置信 度 为 95% 时 、“ 周 三 、 周 六 或 周 日 ”的 总 体 优势 比 的 置信 区 间 


※ ay 的 值 请 参照 第 168 页 。S' 的 值 请 参照 第 177 页 。 








帘 7.“ 检 验 ” 的 名 称 ve 





在 “第 2 章 回 归 分 析 "、“ 第 3 章 重 回归 分 析 ” 和 “第 4 章 Logistic 回归 分 析 ” 
中 ， 出 现 了 这 么 几 种 “检验 ": 回归 系数 的 检验 、 偏 回归 系数 的 检验 、 全 面 讨论 ( 偏 ) 
回归 系数 的 检验 、 分 别 讨论 ( 備 ) 回归 系数 的 检验 、 总 体 优势 比 的 检验 。 

这 些 名 称 是 笔者 自己 的 想法 ， 并 非 通用 的 名 称 。 这 样 做 也 是 苦于 找 不 到 通用 的 
名 称 。 此 外 , 似 然 比 检验 、wald 检验 这 些 名 称 则 是 通用 的 名 称 ,而 非 笔者 自己 的 观点 。 
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& 8. Bubble Chart (气泡 图 ) & 





本 节 所 讲 的 内 容 同 Logistic 回归 分 析 没有 任何 关系 ， 但 是 却 比较 有 用 ， 所 以 在 
这 里 稍 作 介绍 。 
在 第 165 页 中 ， 美 羽 为 了 避免 在 同一 个 地 方 重复 画 点 所 使 用 的 方法 ， 是 一 个 不 


最 终 变 成 一 幅 不 知 所 谓 的 图 ， 同 不 使 用 这 种 方法 也 没什么 差别 。 

人 们 常常 会 使 用 Bubble Chart (气泡 图 ) 这 样 的 图 表 。 所 谓 Bubble Chart， 就 是 
通过 气泡 的 大 小 来 表示 点 的 多 少 的 一 种 图 表 。 

下 图 就 是 同 第 165 页 中 的 图 相对 应 的 Bubble Chart。 





DES ||| 
© 





© 
©. 














诺 伦 特 供 蛋糕 的 销售 情况 


图 4.3 同 第 165 页 中 的 图 相对 应 的 Bubble Chart 
在 “周三 、 周 六 或 周 日 ” 卖 出 的 诺 伦 特 供 蛋糕 ， 以 及 “周三 、 周 六 或 周 日 ”以 
外 没有 卖 出 的 诺 伦 特 供 蛋糕 ， 就 变 得 一 目 了 然 了 。 
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4 附录 4 
用 Excel 算 算 看 


一 Sa 过 一 





附录 中 所 用 数据 已 经 传送 到 网 站 http://www.okbook.co.cn/， 名 为 “数据 - 
回归 .xls” 的 文件 夹 中 ， 请 您 下 载 使 用 。 























这 里 将 对 以 下 内 容 进行 讲解 
1. 自然 对 数 的 底 
2. 指数 函数 
3. 自然 对 数 函数 
4 和 矩阵 的 乘法 
5. 逆 矩 阵 
6. 和 2 分 布 的 横 轴 坐 标 
7. 錠 分 布 的 概 率 
8. 下 分 布 的 横 轴 坐标 
9. 严 分 布 的 概率 
10. (Œ) 回归 分 析 的 ( 偏 ) 回归 系数 
11. Logistic 回归 方程 的 回归 系数 








1. 自然 对 数 的 底 





选择 “B1” 单 元 格 。 


天 


选择 菜单 栏 中 的 “插入 ” 栏 内 的 “函数 ”。 
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在 “选择 类 别 ” 中 选择 “数学 与 三 角 函数 "在 “选择 函数 ”中 选择 “EXP”。 


— 
IT 





直接 输入 1 后 ， 点击“ 确定 ”。 








计算 完毕 。 





tja a E 
lje CRER 2.718282 
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2. 指数 函数 





所 用 数据 见 第 14 页 ， 均 收录 在 “指数 函数 ”表单 中 。 


选择 “B1” 单元 格 , 像 在 Word 文档 中 的 输入 方法 一 样 ,在 其 中 输入 “=2^3” 后 ， 
按 下 “Enter” 键 。 








计算 完毕 ! 








3. 自然 对 数 函 数 





所 用 数据 见 第 22 页 ， 均 收录 在 “自然 对 数 函数 ”表单 中 。 


选择 “B1” 单 元 格 。 
国 ican mmm 
选择 菜单 栏 中 的 “插入 ” 栏 内 的 “函数 "。 


在 “选择 类 别 ” 中 ,选择 “数学 与 三 角 函 数 "， 在 “选择 函数 ”中 选择 “LN ”。 
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直接 输入 “exp (37 Ja, 点击“ 确定 "。 





y | 
log(e 的 8 次 方 ) hexp⑨) | 











计算 完毕 ! 





A eS 
1og(s 的 3 次 方) 


4. 矩阵 的 乘法 





所 用 数据 见 第 41 页 ， 均 收录 在 “ 扼 阵 的 有 法 " 表单 中 
<p> 
选择 “G1” 单 元 格 。 


} aj 5 | e 
1 


pti Nee tae et < 
A 2 4 5 
ws 4 对 4 





选择 菜单 栏 中 的 “插入” 栏 内 的 “函数 ”。 


在 “选择 类 别 ” 中 选择 “数学 与 三 角 函数 ”, 在 “选择 函数 ”中 选择 “MMULT”。 
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选择 下 图 所 示 的 范围 ， 点 击 “ 确 定 ”。 


E zaa 
T «sea 


22* 
DE SORTS iroi HP, IBH rr oe F 





Eke 





以 “G1” 单 元 格 为 起 点 ,按照 下 图 选择 从 “G1” 到 “H2”。 





























-ULT (Al:B2, D1:E2) 
c 





一 起 按 下 “Shift” 键 和 “Ctrl” 键 ， 同 时 再 按 “Enter” 键 。 


计算 完毕 ! 








198 附录 用 Excel 算 算 看 








选择 “D1” 单 元 格 。 


に B ç 
1 2 
2 3 4 


选择 菜单 栏 中 的 “插入 ” 栏 内 的 “函数 ”。 


在 “选择 类 别 " 中 选择 “数学 与 三 角 函数 ”, 在 “选择 函数 ”中 选择 “MINVERSE”。 


选择 下 图 所 示 的 范围 点击“ 确定 ”。 
ーー トニー $ gl c ES 





一 国 -uaza4 


errer] 





— 





以 “D1” 单 元 格 为 起 点 ， 按 照 下 图 选择 从 “D1” 到 “E2"。 
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点 击 数学 公式 栏 中 的 这 一 部 分 。 






IV BAD 格式 @) 


Æ ENINVERSE (A1 :B2)} 
B て 








一 起 按 下 “Shift” 键 和 “Ctrl” 键 ， 同 时 再 按 “Enter” 键 。 


计算 完毕 ! 





6. XX* 分 布 的 模 轴 坐 标 





所 用 数据 见 第 51 页 ， 均 收录 在 “x 分 布 的 模 轴 坐标 ”表单 中 。 


选择 “B3” 单 元 格 。 


选择 菜单 栏 中 的 “插入 ” 栏 内 的 “函数 "。 


在 “选择 类 别 ” 中 选择 “统计 ”， 在 “选择 函数 ”中 选择 “CHIINV”。 
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选择 “B1” 和 “B2” 单 元 格 ， 点 击 “ 确 定 "。 












































z 

z 

5 

$ 

pi 

En 

四 

poj 

a 

Hat Deg trveien BOR. HF 1 4 1010 之 网， FS 1010 

as)” ees 

Hs 

[as] 

Im 

计算 完毕 ! 
7. 总 分 布 的 概率 
选择 “B3” 单 元 格 。 

|A 
ary ae 10.1 
[2 | 自由 度 2 
Be Co) 


选择 菜单 栏 中 的 “ 插 人 ” 栏 内 的 “函数 "。 


201 


在 “选择 类 别 ” 中 选择 “统计 "， 在 “选择 函数 ”中 选择 “CHIDIST 。 


选择 “B1” 和 “B2” 单 元 格 ， 点 击 “ 确 定 "。 


概率 





+ 


Deg trecden BAR, RF 1 10710 2M, FE 10-10 


Besos Cay Cae CW 





tft foo i || 





计算 完毕 ! 
10.1 


2 
0. 006409} 





8.F 分 布 的 横 轴 坐标 








用 数据 见 第 54 页 ， 均 收录 在 “分 布 的 横 轴 华 标 ”表单 中 且 
<p 





选择 “B4” 单 元 格 。 
= A 
| 1 |e 0.05 
(2 | 第 1 自由 度 1 
3 | 第 2 自由 度 12 
F 
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选择 菜单 栏 中 的 “ 插 人 ” 栏 内 的 “函数 "。 


在 “选择 类 别 ” 中 选择 “统计 "， 在 “选择 函数 ”中 选择 “FINV"。 


选择 “B1”"、“B2” 和 “B3” 单 元 格 ， 点击“ 确定 "。 





ey BE cc | op | | rl 
0.05 














ee 
[zj 第 1 自由 度 1 
[3 第 2 自由 度 12 
ir 
zai 
—— 
Ho 
Hy 
Eu = crease 
Tal ERr RRS. OR p = NISTG...) A TING...) = me 
| | cr OOM. AF 1 wie 2m, Fs wio 
pE 
Be itm = creases 
| | axanna Ca Cw 
Ha 
计算 完毕 ! 
0.05 
1 
12 
4.747225] 
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9. F 分布 的 概率 

















选择 “B4” 单 元 格 。 
A 
iF 55.6 
2 | 第 1 自由 度 1 
3 | 第 2 自由 度 12 








选择 菜单 栏 中 的 “插入 ” 栏 内 的 “函数 ”。 


在 “选择 类 别 ” 中 选择 “统计 "， 在 “选择 函数 ”中 选择 “FDIST”。 


选择 “B1”"、“B2” 和 “B3” 单 元 格 ， 点击 “确定 ”。 
A Bi CC | D | gl Tr 
F 55. 6. 


第 1 自由 度 1 
第 2 自由 度 12 
az 





Metin? HEDRER, AATF 1 和 1010 ZA, FO 1010 


iR: 1 erista 


araneae CeCe) 





affable offi lel- 
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“7.67E-06” 是 Excel 中 的 书写 格式 ， 实 际 上 是 “7.67x 10°". 


10. (Hi) 回归 分 析 的 (A) 回归 系数 











选择 “G2” 单 元 格 。 
A — E E E ee ae 
a x 
最 最 x 
rae 52 
を 车 * 
面 业 面 
站 站 项 
kd me tS 
下 下 
* 


x 
B2EBE 10 80 469 BARE | 
SHWAME 8 0 366 
曾 根 店 s 200 371 
— 5 200 208 
HETS 7/300; 246; 
邮政 局 前 店 8,230 297 
水 道 果 站 前 店 “7，40 363 
太 条 站 大 厦 店 | 9; 0 436 
者 叶 川 店 6.330. 198 
美里 店 9 180 364. 




















EE に に に に に トト 園 - 














* 


选择 菜单 栏 中 的 “插入 ” 栏 内 的 “函数 "。 


在 “选择 类 别 ”中 ,选择 “统计 "， 在 “选择 函数 ”中 ,选择 “LINEST"。 
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选择 下 图 所 示 的 范围 点击“ 确定 "。“Const” 和 “Stats” 中 无 需 输入 任何 值 。 
apai sicjpitt r MEE niri girik 
更 E 
a A 
| gid —237 
| DERART ee 
Rew pias 
E E 
A 


Te enm: 
图 .amaoam 
本 








以 “G2” 单 元 格 为 起 点 ， 按 照 下 图 选择 从 “G2” 到 “I2” 


| 





St すす | 
rasa 





WERK 
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点 击 数学 公式 栏 中 的 这 一 部 分 。 








BO BAD 格式 の IAD BE} BOW 


SLINEST (D2:D11, B2:C11) 


一 起 按 下 “Shif” 键 和 “Ctrl” 键 ， 同 时 再 按 “Enter” 键 


计算 完毕 ! 
ET EE 
[3 
最 x 
5282 
E tae 
站 Box 
的 = 
La 
a 
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11. Logistic 回归 方程 的 回归 系数 
“所 用 数据 见 第 -162 Th, SARE “Logistic 回归 方程 的 回归 系数 ”表单 中 。 . 


很 遗憾 ， 在 Excel 中 ， 并 没有 可 以 直接 用 于 求解 Logistic 回归 方程 的 回归 系数 函 
数 。 因 此 ， 本 节 将 介绍 如 何 使 用 Excel 中 的 “Solver” 功 能 来 求解 回归 系数 。 
Solver 


人 @ 选 择 菜单 栏 中 的 “工具 ” 栏 内 的 “加 载 宏 ”。 














208 附录 M Excel 算 算 看 


@ 如 果 出 现 “ 需 要 Excel 的 安装 光盘 ”等 信息 ， 那 么 请 按 指示 操作 。 

按照 以 上 步 又 操作 以 后 ， 我 们 便 可 以 使 用 这 一 功能 了 。 

我 们 可 以 将 第 162 页 的 数据 输入 Excel 表格 。 如 果 读者 朋友 想 要 求解 本 节 示 例 
以 外 的 Logistic 回归 方程 的 回归 函数 ， 那 就 要 根据 实际 情况 输入 相应 的 Excel 函数 。 
























































选择 “L3” 单 元 格 
旧时 eta 和 让 和 二 = Pastel 
| ai if 名 
| 三 | ie * 
cet a 
wn l| alls 
Ke a 的 
Shell alle 
aina p 
日 * it 
| n a 
R me 
2 15 日 星期 一 | 028 1| |0.50 | |a50 mman] 
leg ` mmz | o x lesllss 
s18 星期 三 | 1 3 10.50 | [0.50 
5 (88 星期 四 | om 10.50 | 10.50 | Jat 
elon MME | © dloso|loso ji 
thoa BMA} 1 w 1| |0.50 | |0.50 
1 日 時 期日 | 120 10.50 | |0. 50. 
shaa mm- | o z a| Joso | |aso TT 
wisa amz] oas ol |oso | |oso ROI HEAR 1 
ajisa :星期 三 | 1 1} [0.50 | |0.50 m 0. 04301] 
ls” mmal on al lasa T laso 
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选择 菜单 栏 中 的 “工具 ” 栏 内 的 “规划 求解 ”。 








按照 下 图 进行 设置 ， 然 后 点 击 “ 求 解 ”。 


Ta Ts felpls pe 加 





—8 








We 
it a 
に に る 
a 


nmaga 
—— —— 




















星期 一 
星期 二 
星期 
星期 四 
星期 五 
星期 六 
星期 日 
星期 一 
星期 二 
fil 星期 三 
i12115 日 28a 


28 1| |0.50 | |0.50 | juas 4, 778-07} 


























lo mice nmeomiclo 
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ma p 


muna 


maga 

に た すま ます トキ た た さい 
に た | | 

(Mees Se wR) 上 





[zj5 日 星期 一 | 028 (0.50 | |0.50 | [urma atman] 
6 日 “星期 二 | 0 2 0.50 | Jo. 50 | [rateuri “14.5561 


7 日 星期 三 | 126 0.50 | |o. so 


は 
3 | 1 
ps いり 
4 ol 
8 日 星期 四 | o 24 oj |0.50 | |0.50 | fa 
9 日 “星期 五 | 23 of 0.50 | ja50| jez 
Sos 星 甚大 | 1 28 | [0.50 | foso 
isl ol 
a] 1 
o 
1 





jl 日 ”星期 日 | 1 24 10. 50 | |0.50 
































12 日 “星期 一 | o 26 10. 50 | |0.50 | | 固 变 量 的 值 是 [1] 的 个 体 个 数 引 
10|13 日 “星期 二 | 25 0. 50 | |0. 50 | | 因 变 量 的 值 是 [0] 的 个 体 个 数 13| 
1114 日 星 期 三 | 1 2 0.50 | |0.50 | 加 定 系数 0. 04307) 
alsa Ma! oa glosolloso 





在 第 109 页 中 我 们 讲 过 ,用 最 小 二 乘法 求解 重 回归 方程 的 偏 回归 系数 。 在 " 数 
据 - 回归 .xls” 中 ,为 了 练习 使 用 Solver 功能 来 求解 第 3 章 例题 中 的 偏 回归 系数 ， 


我 们 还 准备 了 “ 重 回归 方程 solvr" 这 样 一 张 工作 表 。 为 了 进一步 熟悉 Solver 功能 ， 
同时 也 为 了 体会 最 小 二 乘法 的 思想 ， 请 您 务必 要 接受 这 一 挑战 。 
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(N-0355.0103) 

责任 编辑 : E R Rw 
责任 制作 : 董 立 颖 魏 说 
封面 制作 : Mir 


用 漫画 这 种 形式 讲 数学 、 物 理 和 统计 学 ， 十 分 有 利于 在 广大 青少年 中 普及 科学 知识 。 


ALR. MEH, MRAM MAL ed te Bd 
中 日 友好 协会 理事 ，《 数 理 天 地 》 顾 问 ， 全 国政 协 原 副 秘书 长 


用 漫画 和 说 故事 的 形式 讲 数学 ， 使 面貌 冷峻 的 数学 变 得 亲切 、 生 动 、 有 趣 ， 使 学 习 数 学 变 得 容 
易 ， 这 对 于 提高 全 民 的 数学 水 平 无 疑 是 功德 无 量 的 事 。 


《数理 天 地 》 杂 志 社 社 长 总 编 
“看 望 杯 ” 全 国 数学 邀请 赛 组 要 会 命题 委员 会 主任 两 a t 


用 漫画 的 形式 ， 讲 解 日 常生 活 中 的 数学 、 物 理 知识 ， 更 能 让 大 家 感受 到 数学 殿堂 的 奥妙 与 乐趣 。 


《光明 日 报 》 原 副 总 编辑 oa 
中 华 炎黄 文化 研究 会 常务 一 会 长 #4 ji 


科学 漫画 是 帮助 学 习 文科 的 人 们 用 形象 思维 的 方式 掌握 自然 科学 的 金 钥匙 。 


中 国人 民 大 学 外 语 当 院 日语 专 业 主任 
大 学 日 请 才学 研究 会 会 长 成 ae 


都 能 看 到 很 多 年 轻 的 白领 看 这 套图 书 ， 经 济 实惠 、 图 文 
定 会 成 为 白领 们 的 手中 爱 物 。 


大 连理 王 关 RASANEN 博士 HRH を sk 


我 非常 希望 能 入 RAR 、 有 卡通 图 、 有 故事 情节 ， 当 然 最 重要 的 还 有 
i 特定 头 提 刊 臣子 们 的 学 习 兴趣 ， 降 低 他 们 对 于 高 深 的 理工 科 知识 









在 日 本 留学 的 时 候 ， 我 在 
HR. AOA, HAI 


/ 北京 启明 星 培 训 学 术 RK ee 


书 中 的 数学 知识 浅显 的 形式 合 知 辺 貼 近 生活 , 概念 更 容易 理解 。 
á 北京 大 学 数学 科学 学 院 博士 ーー 
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